Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
Descripción del Articulo
La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afect...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/28151 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/28151 |
| Nivel de acceso: | acceso abierto |
| Materia: | Automatización Plataformas virtuales Atención https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| id |
UNMS_26ee657986e03d830f643e6a1dfe5194 |
|---|---|
| oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/28151 |
| network_acronym_str |
UNMS |
| network_name_str |
UNMSM-Tesis |
| repository_id_str |
410 |
| dc.title.none.fl_str_mv |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| title |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| spellingShingle |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural Diaz Tunjar, Thalia Automatización Plataformas virtuales Atención https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| title_short |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| title_full |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| title_fullStr |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| title_full_unstemmed |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| title_sort |
Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural |
| author |
Diaz Tunjar, Thalia |
| author_facet |
Diaz Tunjar, Thalia |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Herrera Quispe, José Alfredo |
| dc.contributor.author.fl_str_mv |
Diaz Tunjar, Thalia |
| dc.subject.none.fl_str_mv |
Automatización Plataformas virtuales Atención |
| topic |
Automatización Plataformas virtuales Atención https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| description |
La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la gestión pública. La presente investigación de carácter aplicado y experimental tiene como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones virtual mediante la aplicación de modelos supervisados entrenados con datos reales del sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia, consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización, vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados mediante métricas como precisión, recall y F1-score. Los resultados demuestran que es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos, la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1- score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y aumentando la eficiencia operativa en entornos institucionales digitales. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-11-25T19:18:09Z |
| dc.date.available.none.fl_str_mv |
2025-11-25T19:18:09Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.citation.none.fl_str_mv |
Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/28151 |
| identifier_str_mv |
Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| url |
https://hdl.handle.net/20.500.12672/28151 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.source.none.fl_str_mv |
reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
UNMSM-Tesis |
| collection |
UNMSM-Tesis |
| bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/905b4d47-09ea-40a9-8d7e-684fec1874ce/download https://cybertesis.unmsm.edu.pe/bitstreams/68b8f5a4-886c-418c-8e77-ab1b7ec09bae/download https://cybertesis.unmsm.edu.pe/bitstreams/5bcfe344-aba7-48f6-b74c-6f22b021a57c/download https://cybertesis.unmsm.edu.pe/bitstreams/d941b703-f40a-4e8a-9d69-84c9c0d6f4ae/download https://cybertesis.unmsm.edu.pe/bitstreams/616aa96c-1dc0-4561-ad22-7805738190a9/download https://cybertesis.unmsm.edu.pe/bitstreams/003ebaaf-3ea3-452a-ba5a-6fb42f727898/download https://cybertesis.unmsm.edu.pe/bitstreams/22966e90-8e7f-42a9-b1aa-79c536078214/download https://cybertesis.unmsm.edu.pe/bitstreams/2e1b0b22-124e-4e71-bc1c-d4129763fda2/download https://cybertesis.unmsm.edu.pe/bitstreams/d433b114-d3c5-4e3c-9263-288578301009/download https://cybertesis.unmsm.edu.pe/bitstreams/8d2adef5-a7b4-4c02-8321-8266943cbcc9/download |
| bitstream.checksum.fl_str_mv |
f0bc15bffd48e6b5286b7d608e13051d 1d1aaa77a440f8261095c10da857b0ef 58933a2167101c6a9044cf1563f46dfa bb9bdc0b3349e4284e09149f943790b4 f63d9a0e3dab6df0a8ef04f021ccc1c6 00506c455f1d8cf79ba94b2c51351406 0264233a10ba920426d10a203e5948d9 b7f2700024f103d130fb41dbfdafdaae f626d7e39ff1c691133bee6e0bf3c9c8 94ac103f79fc0e0aa66574ca2a5ed875 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Cybertesis UNMSM |
| repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
| _version_ |
1852326733216219136 |
| spelling |
Herrera Quispe, José AlfredoDiaz Tunjar, Thalia2025-11-25T19:18:09Z2025-11-25T19:18:09Z2025Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/28151La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la gestión pública. La presente investigación de carácter aplicado y experimental tiene como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones virtual mediante la aplicación de modelos supervisados entrenados con datos reales del sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia, consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización, vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados mediante métricas como precisión, recall y F1-score. Los resultados demuestran que es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos, la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1- score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y aumentando la eficiencia operativa en entornos institucionales digitales.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/AutomatizaciónPlataformas virtualesAtenciónhttps://purl.org/pe-repo/ocde/ford#1.02.00https://purl.org/pe-repo/ocde/ford#1.02.01https://purl.org/pe-repo/ocde/ford#1.02.02Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje naturalinfo:eu-repo/semantics/masterThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDUMagíster en Ingeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y ComunicacionesUniversidad Nacional Mayor de San Marcos. Facultad de Ingeniería de Sistemas e Informática. Unidad de PosgradoIngeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y Comunicaciones40362859https://orcid.org/0000-0002-8207-971470813325612487Mauricio Sánchez, David SantosGuerra Guerra, Jorge LeoncioCalderon Vilca, Hugo Davidhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALDiaz_tt.pdfDiaz_tt.pdfapplication/pdf2951400https://cybertesis.unmsm.edu.pe/bitstreams/905b4d47-09ea-40a9-8d7e-684fec1874ce/downloadf0bc15bffd48e6b5286b7d608e13051dMD51Diaz_tt_autorizacion.pdfDiaz_tt_autorizacion.pdfapplication/pdf435532https://cybertesis.unmsm.edu.pe/bitstreams/68b8f5a4-886c-418c-8e77-ab1b7ec09bae/download1d1aaa77a440f8261095c10da857b0efMD52Diaz_tt_reporte de turnitin.pdfDiaz_tt_reporte de turnitin.pdfapplication/pdf11982034https://cybertesis.unmsm.edu.pe/bitstreams/5bcfe344-aba7-48f6-b74c-6f22b021a57c/download58933a2167101c6a9044cf1563f46dfaMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/d941b703-f40a-4e8a-9d69-84c9c0d6f4ae/downloadbb9bdc0b3349e4284e09149f943790b4MD54TEXTDiaz_tt.pdf.txtDiaz_tt.pdf.txtExtracted texttext/plain101993https://cybertesis.unmsm.edu.pe/bitstreams/616aa96c-1dc0-4561-ad22-7805738190a9/downloadf63d9a0e3dab6df0a8ef04f021ccc1c6MD55Diaz_tt_autorizacion.pdf.txtDiaz_tt_autorizacion.pdf.txtExtracted texttext/plain3732https://cybertesis.unmsm.edu.pe/bitstreams/003ebaaf-3ea3-452a-ba5a-6fb42f727898/download00506c455f1d8cf79ba94b2c51351406MD57Diaz_tt_reporte de turnitin.pdf.txtDiaz_tt_reporte de turnitin.pdf.txtExtracted texttext/plain2660https://cybertesis.unmsm.edu.pe/bitstreams/22966e90-8e7f-42a9-b1aa-79c536078214/download0264233a10ba920426d10a203e5948d9MD59THUMBNAILDiaz_tt.pdf.jpgDiaz_tt.pdf.jpgGenerated Thumbnailimage/jpeg16514https://cybertesis.unmsm.edu.pe/bitstreams/2e1b0b22-124e-4e71-bc1c-d4129763fda2/downloadb7f2700024f103d130fb41dbfdafdaaeMD56Diaz_tt_autorizacion.pdf.jpgDiaz_tt_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg20770https://cybertesis.unmsm.edu.pe/bitstreams/d433b114-d3c5-4e3c-9263-288578301009/downloadf626d7e39ff1c691133bee6e0bf3c9c8MD58Diaz_tt_reporte de turnitin.pdf.jpgDiaz_tt_reporte de turnitin.pdf.jpgGenerated Thumbnailimage/jpeg15168https://cybertesis.unmsm.edu.pe/bitstreams/8d2adef5-a7b4-4c02-8321-8266943cbcc9/download94ac103f79fc0e0aa66574ca2a5ed875MD51020.500.12672/28151oai:cybertesis.unmsm.edu.pe:20.500.12672/281512025-11-30 03:11:21.441https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.45743 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).