Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural

Descripción del Articulo

La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afect...

Descripción completa

Detalles Bibliográficos
Autor: Diaz Tunjar, Thalia
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/28151
Enlace del recurso:https://hdl.handle.net/20.500.12672/28151
Nivel de acceso:acceso abierto
Materia:Automatización
Plataformas virtuales
Atención
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
id UNMS_26ee657986e03d830f643e6a1dfe5194
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/28151
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.none.fl_str_mv Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
title Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
spellingShingle Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
Diaz Tunjar, Thalia
Automatización
Plataformas virtuales
Atención
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
title_short Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
title_full Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
title_fullStr Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
title_full_unstemmed Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
title_sort Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
author Diaz Tunjar, Thalia
author_facet Diaz Tunjar, Thalia
author_role author
dc.contributor.advisor.fl_str_mv Herrera Quispe, José Alfredo
dc.contributor.author.fl_str_mv Diaz Tunjar, Thalia
dc.subject.none.fl_str_mv Automatización
Plataformas virtuales
Atención
topic Automatización
Plataformas virtuales
Atención
https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
description La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la gestión pública. La presente investigación de carácter aplicado y experimental tiene como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones virtual mediante la aplicación de modelos supervisados entrenados con datos reales del sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia, consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización, vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados mediante métricas como precisión, recall y F1-score. Los resultados demuestran que es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos, la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1- score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y aumentando la eficiencia operativa en entornos institucionales digitales.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-11-25T19:18:09Z
dc.date.available.none.fl_str_mv 2025-11-25T19:18:09Z
dc.date.issued.fl_str_mv 2025
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.citation.none.fl_str_mv Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/28151
identifier_str_mv Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
url https://hdl.handle.net/20.500.12672/28151
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/905b4d47-09ea-40a9-8d7e-684fec1874ce/download
https://cybertesis.unmsm.edu.pe/bitstreams/68b8f5a4-886c-418c-8e77-ab1b7ec09bae/download
https://cybertesis.unmsm.edu.pe/bitstreams/5bcfe344-aba7-48f6-b74c-6f22b021a57c/download
https://cybertesis.unmsm.edu.pe/bitstreams/d941b703-f40a-4e8a-9d69-84c9c0d6f4ae/download
https://cybertesis.unmsm.edu.pe/bitstreams/616aa96c-1dc0-4561-ad22-7805738190a9/download
https://cybertesis.unmsm.edu.pe/bitstreams/003ebaaf-3ea3-452a-ba5a-6fb42f727898/download
https://cybertesis.unmsm.edu.pe/bitstreams/22966e90-8e7f-42a9-b1aa-79c536078214/download
https://cybertesis.unmsm.edu.pe/bitstreams/2e1b0b22-124e-4e71-bc1c-d4129763fda2/download
https://cybertesis.unmsm.edu.pe/bitstreams/d433b114-d3c5-4e3c-9263-288578301009/download
https://cybertesis.unmsm.edu.pe/bitstreams/8d2adef5-a7b4-4c02-8321-8266943cbcc9/download
bitstream.checksum.fl_str_mv f0bc15bffd48e6b5286b7d608e13051d
1d1aaa77a440f8261095c10da857b0ef
58933a2167101c6a9044cf1563f46dfa
bb9bdc0b3349e4284e09149f943790b4
f63d9a0e3dab6df0a8ef04f021ccc1c6
00506c455f1d8cf79ba94b2c51351406
0264233a10ba920426d10a203e5948d9
b7f2700024f103d130fb41dbfdafdaae
f626d7e39ff1c691133bee6e0bf3c9c8
94ac103f79fc0e0aa66574ca2a5ed875
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1852326733216219136
spelling Herrera Quispe, José AlfredoDiaz Tunjar, Thalia2025-11-25T19:18:09Z2025-11-25T19:18:09Z2025Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/28151La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la gestión pública. La presente investigación de carácter aplicado y experimental tiene como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones virtual mediante la aplicación de modelos supervisados entrenados con datos reales del sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia, consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización, vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados mediante métricas como precisión, recall y F1-score. Los resultados demuestran que es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos, la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1- score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y aumentando la eficiencia operativa en entornos institucionales digitales.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/AutomatizaciónPlataformas virtualesAtenciónhttps://purl.org/pe-repo/ocde/ford#1.02.00https://purl.org/pe-repo/ocde/ford#1.02.01https://purl.org/pe-repo/ocde/ford#1.02.02Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje naturalinfo:eu-repo/semantics/masterThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDUMagíster en Ingeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y ComunicacionesUniversidad Nacional Mayor de San Marcos. Facultad de Ingeniería de Sistemas e Informática. Unidad de PosgradoIngeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y Comunicaciones40362859https://orcid.org/0000-0002-8207-971470813325612487Mauricio Sánchez, David SantosGuerra Guerra, Jorge LeoncioCalderon Vilca, Hugo Davidhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALDiaz_tt.pdfDiaz_tt.pdfapplication/pdf2951400https://cybertesis.unmsm.edu.pe/bitstreams/905b4d47-09ea-40a9-8d7e-684fec1874ce/downloadf0bc15bffd48e6b5286b7d608e13051dMD51Diaz_tt_autorizacion.pdfDiaz_tt_autorizacion.pdfapplication/pdf435532https://cybertesis.unmsm.edu.pe/bitstreams/68b8f5a4-886c-418c-8e77-ab1b7ec09bae/download1d1aaa77a440f8261095c10da857b0efMD52Diaz_tt_reporte de turnitin.pdfDiaz_tt_reporte de turnitin.pdfapplication/pdf11982034https://cybertesis.unmsm.edu.pe/bitstreams/5bcfe344-aba7-48f6-b74c-6f22b021a57c/download58933a2167101c6a9044cf1563f46dfaMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/d941b703-f40a-4e8a-9d69-84c9c0d6f4ae/downloadbb9bdc0b3349e4284e09149f943790b4MD54TEXTDiaz_tt.pdf.txtDiaz_tt.pdf.txtExtracted texttext/plain101993https://cybertesis.unmsm.edu.pe/bitstreams/616aa96c-1dc0-4561-ad22-7805738190a9/downloadf63d9a0e3dab6df0a8ef04f021ccc1c6MD55Diaz_tt_autorizacion.pdf.txtDiaz_tt_autorizacion.pdf.txtExtracted texttext/plain3732https://cybertesis.unmsm.edu.pe/bitstreams/003ebaaf-3ea3-452a-ba5a-6fb42f727898/download00506c455f1d8cf79ba94b2c51351406MD57Diaz_tt_reporte de turnitin.pdf.txtDiaz_tt_reporte de turnitin.pdf.txtExtracted texttext/plain2660https://cybertesis.unmsm.edu.pe/bitstreams/22966e90-8e7f-42a9-b1aa-79c536078214/download0264233a10ba920426d10a203e5948d9MD59THUMBNAILDiaz_tt.pdf.jpgDiaz_tt.pdf.jpgGenerated Thumbnailimage/jpeg16514https://cybertesis.unmsm.edu.pe/bitstreams/2e1b0b22-124e-4e71-bc1c-d4129763fda2/downloadb7f2700024f103d130fb41dbfdafdaaeMD56Diaz_tt_autorizacion.pdf.jpgDiaz_tt_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg20770https://cybertesis.unmsm.edu.pe/bitstreams/d433b114-d3c5-4e3c-9263-288578301009/downloadf626d7e39ff1c691133bee6e0bf3c9c8MD58Diaz_tt_reporte de turnitin.pdf.jpgDiaz_tt_reporte de turnitin.pdf.jpgGenerated Thumbnailimage/jpeg15168https://cybertesis.unmsm.edu.pe/bitstreams/8d2adef5-a7b4-4c02-8321-8266943cbcc9/download94ac103f79fc0e0aa66574ca2a5ed875MD51020.500.12672/28151oai:cybertesis.unmsm.edu.pe:20.500.12672/281512025-11-30 03:11:21.441https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.45743
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).