Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
Descripción del Articulo
Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el ti...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Privada Antenor Orrego |
| Repositorio: | UPAO-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.upao.edu.pe:20.500.12759/88072 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12759/88072 |
| Nivel de acceso: | acceso abierto |
| Materia: | Procesamiento de Lenguaje Natural Aumento de Datos https://purl.org/pe-repo/ocde/ford#3.02.27 |
| id |
UPAO_e728e5ea79aec0d0d052fc78d890f1db |
|---|---|
| oai_identifier_str |
oai:repositorio.upao.edu.pe:20.500.12759/88072 |
| network_acronym_str |
UPAO |
| network_name_str |
UPAO-Tesis |
| repository_id_str |
3230 |
| dc.title.none.fl_str_mv |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| title |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| spellingShingle |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 Palacios Castillo, Jesus Rafael Procesamiento de Lenguaje Natural Aumento de Datos https://purl.org/pe-repo/ocde/ford#3.02.27 |
| title_short |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| title_full |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| title_fullStr |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| title_full_unstemmed |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| title_sort |
Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025 |
| author |
Palacios Castillo, Jesus Rafael |
| author_facet |
Palacios Castillo, Jesus Rafael Soto Varas, Ruben Sebastian |
| author_role |
author |
| author2 |
Soto Varas, Ruben Sebastian |
| author2_role |
author |
| dc.contributor.advisor.fl_str_mv |
Leturia Rodriguez, Walter Ivan |
| dc.contributor.author.fl_str_mv |
Palacios Castillo, Jesus Rafael Soto Varas, Ruben Sebastian |
| dc.subject.none.fl_str_mv |
Procesamiento de Lenguaje Natural Aumento de Datos |
| topic |
Procesamiento de Lenguaje Natural Aumento de Datos https://purl.org/pe-repo/ocde/ford#3.02.27 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#3.02.27 |
| description |
Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el tiempo que demanda la lectura y análisis de estas notas clínicas, las cuales son clave para la continuidad del cuidado del paciente. Para enfrentar este desafío, se recopilaron y preprocesaron notas de enfermería obtenidas de diferentes instituciones de salud, la cantidad de notas obtenidas ascendió a 41 ejemplares. El siguiente paso fue limpiar los datos obtenidos, digitalizarlos y aumentar los datos mediante diversas tecnicas de Data Augmentation, como Synonym Replacement, Back Translate, Paraphrasing with generative model y Contextual Word Embeddings Augmentation. Mediante estas técnicas, logramos obtener más inputs para mejorar el entrenamiento y refinar los outputs de los modelos de lenguaje natural (NLP) preentrenados que utilizamos. Mediante la revisión de estados del arte, estimamos emplear Google MT-5 y BRET, a los modelos previamente mencionados les aplicamos fine tuning, de modo que pudimos especializarlos en el contexto de notas de enfermería. Para establecer nuestras mediciones de evaluación y rendimiento de los resúmenes generados, utilizamos métricas automáticas ROUGE y BLEU y validación experta, mediante una encuesta a profesionales del sector salud, quienes determinaron la coherencia y la aplicabilidad practica de los, para sintetizar el texto y disminuir el tiempo de lectura, manteniendo el contexto clínico esencial. Por tanto, esta investigación demuestra la viabilidad y efectividad de aplicar el Fine Tuning en modelos NLP, para especializarlos en entornos médicos en textos en español, generando resúmenes, por tanto, mejorando la eficiencia y disminuyendo el riesgo latente de errores clínico, relacionados a la sobrecarga de información. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-10-03T22:06:25Z |
| dc.date.available.none.fl_str_mv |
2025-10-03T22:06:25Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12759/88072 |
| url |
https://hdl.handle.net/20.500.12759/88072 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.relation.ispartofseries.none.fl_str_mv |
T_INGS_014 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.spatial.none.fl_str_mv |
Trujillo |
| dc.publisher.none.fl_str_mv |
Universidad Privada Antenor Orrego |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Privada Antenor Orrego |
| dc.source.none.fl_str_mv |
reponame:UPAO-Tesis instname:Universidad Privada Antenor Orrego instacron:UPAO |
| instname_str |
Universidad Privada Antenor Orrego |
| instacron_str |
UPAO |
| institution |
UPAO |
| reponame_str |
UPAO-Tesis |
| collection |
UPAO-Tesis |
| bitstream.url.fl_str_mv |
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d7de7ce8-0487-4433-a92b-0e7cc1668f8e/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/364cb247-de4c-4cfd-a459-1bc5b6570806/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8adf454c-2228-469d-a685-8b65e2033da9/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/33f9a916-554b-47d4-9416-25abb8c4b9ef/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/16bc7887-f50b-4b6a-a148-83ad9a2bde58/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/74c28ee4-30c2-4b02-96fe-4667402f9e67/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4b12b72e-3366-4d70-91ea-1f8531c19a1e/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0038c818-f881-4a20-bca0-8059632b861a/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d0a51bd7-b102-461f-b40a-771d716cc65e/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/cd16c617-6dd1-4dab-80cb-c79673a654a2/content |
| bitstream.checksum.fl_str_mv |
458bb9fdf8bd5d842fb4333a5332bc18 66bdedff0c7b7ab12fa5491f3b87448f 53e6170ee4b3a56f1fbe1c6211eea22e bb9bdc0b3349e4284e09149f943790b4 8810524e9572c849c20c9e7742d242ea 33894dc82bcf5c3c1dd9015cde0d55ff ff4c8ff01d544500ea4bfea43e6108c1 876a58f075c97fd507df714b50b628dd 93163dbf9038005290c5bda76aaeeb76 2362e4ac26e391ac339e6e5bd2c71fbe |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de la Universidad Privada Antenor Orrego |
| repository.mail.fl_str_mv |
biblio_repositorio@upao.edu.pe |
| _version_ |
1846703118095482880 |
| spelling |
Leturia Rodriguez, Walter IvanPalacios Castillo, Jesus RafaelSoto Varas, Ruben Sebastian2025-10-03T22:06:25Z2025-10-03T22:06:25Z2025https://hdl.handle.net/20.500.12759/88072Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el tiempo que demanda la lectura y análisis de estas notas clínicas, las cuales son clave para la continuidad del cuidado del paciente. Para enfrentar este desafío, se recopilaron y preprocesaron notas de enfermería obtenidas de diferentes instituciones de salud, la cantidad de notas obtenidas ascendió a 41 ejemplares. El siguiente paso fue limpiar los datos obtenidos, digitalizarlos y aumentar los datos mediante diversas tecnicas de Data Augmentation, como Synonym Replacement, Back Translate, Paraphrasing with generative model y Contextual Word Embeddings Augmentation. Mediante estas técnicas, logramos obtener más inputs para mejorar el entrenamiento y refinar los outputs de los modelos de lenguaje natural (NLP) preentrenados que utilizamos. Mediante la revisión de estados del arte, estimamos emplear Google MT-5 y BRET, a los modelos previamente mencionados les aplicamos fine tuning, de modo que pudimos especializarlos en el contexto de notas de enfermería. Para establecer nuestras mediciones de evaluación y rendimiento de los resúmenes generados, utilizamos métricas automáticas ROUGE y BLEU y validación experta, mediante una encuesta a profesionales del sector salud, quienes determinaron la coherencia y la aplicabilidad practica de los, para sintetizar el texto y disminuir el tiempo de lectura, manteniendo el contexto clínico esencial. Por tanto, esta investigación demuestra la viabilidad y efectividad de aplicar el Fine Tuning en modelos NLP, para especializarlos en entornos médicos en textos en español, generando resúmenes, por tanto, mejorando la eficiencia y disminuyendo el riesgo latente de errores clínico, relacionados a la sobrecarga de información.This research endeavors to employ natural language processing (NLP) and fine-tuning techniques to generate coherent summaries of nursing notes within health centers in Trujillo. The primary focus of this research lies in addressing the substantial workload faced by nursing staff and the time-consuming process of reading and analyzing these clinical notes, which are pivotal for maintaining the continuity of patient care. To address this challenge, a comprehensive compilation and preprocessing of nursing notes from various health institutions was undertaken, resulting in a total of 41 copies. Subsequently, the obtained data underwent meticulous cleaning, digitization, and augmentation through diverse Data Augmentation techniques, including synonym replacement, back translation, paraphrasing with generative models, and contextual word embeddings augmentation. These techniques enabled the acquisition of a substantial number of inputs, thereby enhancing the training and refining the outputs of the pre-trained natural language models (NLP) employed. Drawing upon a review of state-of-the-art research, the research team (my collegue and I) have identified Google MT-5 and BRET as potential suitable models for use. These models were subjected to fine-tuning to specialize them primarily in the context of nursing notes. To evaluate and assess the generated abstracts, the research team employed ROUGE and BLEU automatic metrics and conducted expert validation through a survey of health sector professionals. Expert feedback confirmed the practical applicability of the generated summaries for reducing review time while maintaining essential clinical content. This research demonstrates the feasibility and effectiveness of applying fine-tuned NLP models to summarize specialized medical texts in Spanish, providing a methodological foundation for integrating intelligent summarization tools into healthcare systems, thereby improving efficiency and reducing the risk of clinical errors related to information overload.application/pdfspaUniversidad Privada Antenor OrregoPET_INGS_014SUNEDUinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Procesamiento de Lenguaje NaturalAumento de Datoshttps://purl.org/pe-repo/ocde/ford#3.02.27Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025info:eu-repo/semantics/bachelorThesisTrujilloreponame:UPAO-Tesisinstname:Universidad Privada Antenor Orregoinstacron:UPAOUniversidad Privada Antenor Orrego - Facultad de IngenieríaIngeniero de SoftwareIngeniería de Softwarehttps://orcid.org/0000-0002-8184-2140738939377035558076644874https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional722026Urrelo Huiman, Luis VladimirGaytan Toledo, Carlos AlbertoRodriguez Aguirre, Silvia AnaORIGINALREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdfREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdfapplication/pdf2530686https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d7de7ce8-0487-4433-a92b-0e7cc1668f8e/content458bb9fdf8bd5d842fb4333a5332bc18MD51TURNIITN_PALACIOS_SOTO.pdfapplication/pdf11527472https://repositorio.upao.edu.pe/backend/api/core/bitstreams/364cb247-de4c-4cfd-a459-1bc5b6570806/content66bdedff0c7b7ab12fa5491f3b87448fMD53AUTORIZACION_PALACIOS_SOTO.pdfapplication/pdf292574https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8adf454c-2228-469d-a685-8b65e2033da9/content53e6170ee4b3a56f1fbe1c6211eea22eMD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.upao.edu.pe/backend/api/core/bitstreams/33f9a916-554b-47d4-9416-25abb8c4b9ef/contentbb9bdc0b3349e4284e09149f943790b4MD52TEXTREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.txtREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.txtExtracted texttext/plain101538https://repositorio.upao.edu.pe/backend/api/core/bitstreams/16bc7887-f50b-4b6a-a148-83ad9a2bde58/content8810524e9572c849c20c9e7742d242eaMD55TURNIITN_PALACIOS_SOTO.pdf.txtTURNIITN_PALACIOS_SOTO.pdf.txtExtracted texttext/plain3286https://repositorio.upao.edu.pe/backend/api/core/bitstreams/74c28ee4-30c2-4b02-96fe-4667402f9e67/content33894dc82bcf5c3c1dd9015cde0d55ffMD57AUTORIZACION_PALACIOS_SOTO.pdf.txtAUTORIZACION_PALACIOS_SOTO.pdf.txtExtracted texttext/plain4https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4b12b72e-3366-4d70-91ea-1f8531c19a1e/contentff4c8ff01d544500ea4bfea43e6108c1MD59THUMBNAILREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.jpgREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.jpgGenerated Thumbnailimage/jpeg23684https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0038c818-f881-4a20-bca0-8059632b861a/content876a58f075c97fd507df714b50b628ddMD56TURNIITN_PALACIOS_SOTO.pdf.jpgTURNIITN_PALACIOS_SOTO.pdf.jpgGenerated Thumbnailimage/jpeg14169https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d0a51bd7-b102-461f-b40a-771d716cc65e/content93163dbf9038005290c5bda76aaeeb76MD58AUTORIZACION_PALACIOS_SOTO.pdf.jpgAUTORIZACION_PALACIOS_SOTO.pdf.jpgGenerated Thumbnailimage/jpeg47948https://repositorio.upao.edu.pe/backend/api/core/bitstreams/cd16c617-6dd1-4dab-80cb-c79673a654a2/content2362e4ac26e391ac339e6e5bd2c71fbeMD51020.500.12759/88072oai:repositorio.upao.edu.pe:20.500.12759/880722025-10-04 03:08:17.503https://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.upao.edu.peRepositorio de la Universidad Privada Antenor Orregobiblio_repositorio@upao.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.861517 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).