Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025

Descripción del Articulo

Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el ti...

Descripción completa

Detalles Bibliográficos
Autores: Palacios Castillo, Jesus Rafael, Soto Varas, Ruben Sebastian
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Privada Antenor Orrego
Repositorio:UPAO-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.upao.edu.pe:20.500.12759/88072
Enlace del recurso:https://hdl.handle.net/20.500.12759/88072
Nivel de acceso:acceso abierto
Materia:Procesamiento de Lenguaje Natural
Aumento de Datos
https://purl.org/pe-repo/ocde/ford#3.02.27
id UPAO_e728e5ea79aec0d0d052fc78d890f1db
oai_identifier_str oai:repositorio.upao.edu.pe:20.500.12759/88072
network_acronym_str UPAO
network_name_str UPAO-Tesis
repository_id_str 3230
dc.title.none.fl_str_mv Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
title Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
spellingShingle Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
Palacios Castillo, Jesus Rafael
Procesamiento de Lenguaje Natural
Aumento de Datos
https://purl.org/pe-repo/ocde/ford#3.02.27
title_short Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
title_full Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
title_fullStr Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
title_full_unstemmed Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
title_sort Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025
author Palacios Castillo, Jesus Rafael
author_facet Palacios Castillo, Jesus Rafael
Soto Varas, Ruben Sebastian
author_role author
author2 Soto Varas, Ruben Sebastian
author2_role author
dc.contributor.advisor.fl_str_mv Leturia Rodriguez, Walter Ivan
dc.contributor.author.fl_str_mv Palacios Castillo, Jesus Rafael
Soto Varas, Ruben Sebastian
dc.subject.none.fl_str_mv Procesamiento de Lenguaje Natural
Aumento de Datos
topic Procesamiento de Lenguaje Natural
Aumento de Datos
https://purl.org/pe-repo/ocde/ford#3.02.27
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#3.02.27
description Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el tiempo que demanda la lectura y análisis de estas notas clínicas, las cuales son clave para la continuidad del cuidado del paciente. Para enfrentar este desafío, se recopilaron y preprocesaron notas de enfermería obtenidas de diferentes instituciones de salud, la cantidad de notas obtenidas ascendió a 41 ejemplares. El siguiente paso fue limpiar los datos obtenidos, digitalizarlos y aumentar los datos mediante diversas tecnicas de Data Augmentation, como Synonym Replacement, Back Translate, Paraphrasing with generative model y Contextual Word Embeddings Augmentation. Mediante estas técnicas, logramos obtener más inputs para mejorar el entrenamiento y refinar los outputs de los modelos de lenguaje natural (NLP) preentrenados que utilizamos. Mediante la revisión de estados del arte, estimamos emplear Google MT-5 y BRET, a los modelos previamente mencionados les aplicamos fine tuning, de modo que pudimos especializarlos en el contexto de notas de enfermería. Para establecer nuestras mediciones de evaluación y rendimiento de los resúmenes generados, utilizamos métricas automáticas ROUGE y BLEU y validación experta, mediante una encuesta a profesionales del sector salud, quienes determinaron la coherencia y la aplicabilidad practica de los, para sintetizar el texto y disminuir el tiempo de lectura, manteniendo el contexto clínico esencial. Por tanto, esta investigación demuestra la viabilidad y efectividad de aplicar el Fine Tuning en modelos NLP, para especializarlos en entornos médicos en textos en español, generando resúmenes, por tanto, mejorando la eficiencia y disminuyendo el riesgo latente de errores clínico, relacionados a la sobrecarga de información.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-10-03T22:06:25Z
dc.date.available.none.fl_str_mv 2025-10-03T22:06:25Z
dc.date.issued.fl_str_mv 2025
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12759/88072
url https://hdl.handle.net/20.500.12759/88072
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.relation.ispartofseries.none.fl_str_mv T_INGS_014
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.none.fl_str_mv application/pdf
dc.coverage.spatial.none.fl_str_mv Trujillo
dc.publisher.none.fl_str_mv Universidad Privada Antenor Orrego
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Privada Antenor Orrego
dc.source.none.fl_str_mv reponame:UPAO-Tesis
instname:Universidad Privada Antenor Orrego
instacron:UPAO
instname_str Universidad Privada Antenor Orrego
instacron_str UPAO
institution UPAO
reponame_str UPAO-Tesis
collection UPAO-Tesis
bitstream.url.fl_str_mv https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d7de7ce8-0487-4433-a92b-0e7cc1668f8e/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/364cb247-de4c-4cfd-a459-1bc5b6570806/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8adf454c-2228-469d-a685-8b65e2033da9/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/33f9a916-554b-47d4-9416-25abb8c4b9ef/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/16bc7887-f50b-4b6a-a148-83ad9a2bde58/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/74c28ee4-30c2-4b02-96fe-4667402f9e67/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4b12b72e-3366-4d70-91ea-1f8531c19a1e/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0038c818-f881-4a20-bca0-8059632b861a/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d0a51bd7-b102-461f-b40a-771d716cc65e/content
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/cd16c617-6dd1-4dab-80cb-c79673a654a2/content
bitstream.checksum.fl_str_mv 458bb9fdf8bd5d842fb4333a5332bc18
66bdedff0c7b7ab12fa5491f3b87448f
53e6170ee4b3a56f1fbe1c6211eea22e
bb9bdc0b3349e4284e09149f943790b4
8810524e9572c849c20c9e7742d242ea
33894dc82bcf5c3c1dd9015cde0d55ff
ff4c8ff01d544500ea4bfea43e6108c1
876a58f075c97fd507df714b50b628dd
93163dbf9038005290c5bda76aaeeb76
2362e4ac26e391ac339e6e5bd2c71fbe
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad Privada Antenor Orrego
repository.mail.fl_str_mv biblio_repositorio@upao.edu.pe
_version_ 1846703118095482880
spelling Leturia Rodriguez, Walter IvanPalacios Castillo, Jesus RafaelSoto Varas, Ruben Sebastian2025-10-03T22:06:25Z2025-10-03T22:06:25Z2025https://hdl.handle.net/20.500.12759/88072Esta presente investigación tiene como objetivo aplicar técnicas de procesamiento de lenguaje natural (NLP) y fine tuning para generar resúmenes coherentes de notas de enfermería en centros de salud de Trujillo. La problemática se centra en la sobrecarga de trabajo del personal de enfermería y el tiempo que demanda la lectura y análisis de estas notas clínicas, las cuales son clave para la continuidad del cuidado del paciente. Para enfrentar este desafío, se recopilaron y preprocesaron notas de enfermería obtenidas de diferentes instituciones de salud, la cantidad de notas obtenidas ascendió a 41 ejemplares. El siguiente paso fue limpiar los datos obtenidos, digitalizarlos y aumentar los datos mediante diversas tecnicas de Data Augmentation, como Synonym Replacement, Back Translate, Paraphrasing with generative model y Contextual Word Embeddings Augmentation. Mediante estas técnicas, logramos obtener más inputs para mejorar el entrenamiento y refinar los outputs de los modelos de lenguaje natural (NLP) preentrenados que utilizamos. Mediante la revisión de estados del arte, estimamos emplear Google MT-5 y BRET, a los modelos previamente mencionados les aplicamos fine tuning, de modo que pudimos especializarlos en el contexto de notas de enfermería. Para establecer nuestras mediciones de evaluación y rendimiento de los resúmenes generados, utilizamos métricas automáticas ROUGE y BLEU y validación experta, mediante una encuesta a profesionales del sector salud, quienes determinaron la coherencia y la aplicabilidad practica de los, para sintetizar el texto y disminuir el tiempo de lectura, manteniendo el contexto clínico esencial. Por tanto, esta investigación demuestra la viabilidad y efectividad de aplicar el Fine Tuning en modelos NLP, para especializarlos en entornos médicos en textos en español, generando resúmenes, por tanto, mejorando la eficiencia y disminuyendo el riesgo latente de errores clínico, relacionados a la sobrecarga de información.This research endeavors to employ natural language processing (NLP) and fine-tuning techniques to generate coherent summaries of nursing notes within health centers in Trujillo. The primary focus of this research lies in addressing the substantial workload faced by nursing staff and the time-consuming process of reading and analyzing these clinical notes, which are pivotal for maintaining the continuity of patient care. To address this challenge, a comprehensive compilation and preprocessing of nursing notes from various health institutions was undertaken, resulting in a total of 41 copies. Subsequently, the obtained data underwent meticulous cleaning, digitization, and augmentation through diverse Data Augmentation techniques, including synonym replacement, back translation, paraphrasing with generative models, and contextual word embeddings augmentation. These techniques enabled the acquisition of a substantial number of inputs, thereby enhancing the training and refining the outputs of the pre-trained natural language models (NLP) employed. Drawing upon a review of state-of-the-art research, the research team (my collegue and I) have identified Google MT-5 and BRET as potential suitable models for use. These models were subjected to fine-tuning to specialize them primarily in the context of nursing notes. To evaluate and assess the generated abstracts, the research team employed ROUGE and BLEU automatic metrics and conducted expert validation through a survey of health sector professionals. Expert feedback confirmed the practical applicability of the generated summaries for reducing review time while maintaining essential clinical content. This research demonstrates the feasibility and effectiveness of applying fine-tuned NLP models to summarize specialized medical texts in Spanish, providing a methodological foundation for integrating intelligent summarization tools into healthcare systems, thereby improving efficiency and reducing the risk of clinical errors related to information overload.application/pdfspaUniversidad Privada Antenor OrregoPET_INGS_014SUNEDUinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Procesamiento de Lenguaje NaturalAumento de Datoshttps://purl.org/pe-repo/ocde/ford#3.02.27Resumen de notas de enfermería en centros de salud de Trujillo mediante procesamiento de lenguaje natural y Fine Tuning 2025info:eu-repo/semantics/bachelorThesisTrujilloreponame:UPAO-Tesisinstname:Universidad Privada Antenor Orregoinstacron:UPAOUniversidad Privada Antenor Orrego - Facultad de IngenieríaIngeniero de SoftwareIngeniería de Softwarehttps://orcid.org/0000-0002-8184-2140738939377035558076644874https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional722026Urrelo Huiman, Luis VladimirGaytan Toledo, Carlos AlbertoRodriguez Aguirre, Silvia AnaORIGINALREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdfREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdfapplication/pdf2530686https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d7de7ce8-0487-4433-a92b-0e7cc1668f8e/content458bb9fdf8bd5d842fb4333a5332bc18MD51TURNIITN_PALACIOS_SOTO.pdfapplication/pdf11527472https://repositorio.upao.edu.pe/backend/api/core/bitstreams/364cb247-de4c-4cfd-a459-1bc5b6570806/content66bdedff0c7b7ab12fa5491f3b87448fMD53AUTORIZACION_PALACIOS_SOTO.pdfapplication/pdf292574https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8adf454c-2228-469d-a685-8b65e2033da9/content53e6170ee4b3a56f1fbe1c6211eea22eMD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.upao.edu.pe/backend/api/core/bitstreams/33f9a916-554b-47d4-9416-25abb8c4b9ef/contentbb9bdc0b3349e4284e09149f943790b4MD52TEXTREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.txtREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.txtExtracted texttext/plain101538https://repositorio.upao.edu.pe/backend/api/core/bitstreams/16bc7887-f50b-4b6a-a148-83ad9a2bde58/content8810524e9572c849c20c9e7742d242eaMD55TURNIITN_PALACIOS_SOTO.pdf.txtTURNIITN_PALACIOS_SOTO.pdf.txtExtracted texttext/plain3286https://repositorio.upao.edu.pe/backend/api/core/bitstreams/74c28ee4-30c2-4b02-96fe-4667402f9e67/content33894dc82bcf5c3c1dd9015cde0d55ffMD57AUTORIZACION_PALACIOS_SOTO.pdf.txtAUTORIZACION_PALACIOS_SOTO.pdf.txtExtracted texttext/plain4https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4b12b72e-3366-4d70-91ea-1f8531c19a1e/contentff4c8ff01d544500ea4bfea43e6108c1MD59THUMBNAILREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.jpgREP_JESUS.PALACIOS_RUBEN.SOTO_RESUMEN.DE.NOTAS.pdf.jpgGenerated Thumbnailimage/jpeg23684https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0038c818-f881-4a20-bca0-8059632b861a/content876a58f075c97fd507df714b50b628ddMD56TURNIITN_PALACIOS_SOTO.pdf.jpgTURNIITN_PALACIOS_SOTO.pdf.jpgGenerated Thumbnailimage/jpeg14169https://repositorio.upao.edu.pe/backend/api/core/bitstreams/d0a51bd7-b102-461f-b40a-771d716cc65e/content93163dbf9038005290c5bda76aaeeb76MD58AUTORIZACION_PALACIOS_SOTO.pdf.jpgAUTORIZACION_PALACIOS_SOTO.pdf.jpgGenerated Thumbnailimage/jpeg47948https://repositorio.upao.edu.pe/backend/api/core/bitstreams/cd16c617-6dd1-4dab-80cb-c79673a654a2/content2362e4ac26e391ac339e6e5bd2c71fbeMD51020.500.12759/88072oai:repositorio.upao.edu.pe:20.500.12759/880722025-10-04 03:08:17.503https://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.upao.edu.peRepositorio de la Universidad Privada Antenor Orregobiblio_repositorio@upao.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.861517
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).