Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
Descripción del Articulo
Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dat...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/27185 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/27185 |
| Nivel de acceso: | acceso abierto |
| Materia: | Machine Learning Identificación Lexicografía Inteligencia artificial https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
UNMS_b2bbc2eaa803c7cb93e79a87b8260684 |
|---|---|
| oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/27185 |
| network_acronym_str |
UNMS |
| network_name_str |
UNMSM-Tesis |
| repository_id_str |
410 |
| dc.title.none.fl_str_mv |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| title |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| spellingShingle |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca Mera Dávila, Luis Iván Machine Learning Identificación Lexicografía Inteligencia artificial https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| title_full |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| title_fullStr |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| title_full_unstemmed |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| title_sort |
Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca |
| author |
Mera Dávila, Luis Iván |
| author_facet |
Mera Dávila, Luis Iván |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Castañeda Vargas, Pedro Segundo |
| dc.contributor.author.fl_str_mv |
Mera Dávila, Luis Iván |
| dc.subject.none.fl_str_mv |
Machine Learning Identificación Lexicografía Inteligencia artificial |
| topic |
Machine Learning Identificación Lexicografía Inteligencia artificial https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas. Los resultados en el contexto educativo demostraron un desempeño superior a los baselines establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos computacionales evaluados. Se determinó la efectividad del modelo de machine learning para la predicción binaria de la complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo, lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado. Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-08-28T13:52:26Z |
| dc.date.available.none.fl_str_mv |
2025-08-28T13:52:26Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.citation.none.fl_str_mv |
Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/27185 |
| identifier_str_mv |
Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM. |
| url |
https://hdl.handle.net/20.500.12672/27185 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.source.none.fl_str_mv |
reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
UNMSM-Tesis |
| collection |
UNMSM-Tesis |
| bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/d7865ea7-5e7a-4dfe-9d82-c8bd70ef571f/download https://cybertesis.unmsm.edu.pe/bitstreams/0be9b67d-bb58-4ffa-9673-0cfb94b4119c/download https://cybertesis.unmsm.edu.pe/bitstreams/69583442-e4ef-46fa-af21-5d73ad677cd5/download https://cybertesis.unmsm.edu.pe/bitstreams/751408e1-0267-4790-a095-006216207b1a/download https://cybertesis.unmsm.edu.pe/bitstreams/b2ad5b4b-66e7-4c08-9d75-2a4fd4150392/download https://cybertesis.unmsm.edu.pe/bitstreams/87121d6b-11b7-4bd5-ad40-21fa39418a47/download https://cybertesis.unmsm.edu.pe/bitstreams/54256c91-57c7-417a-a465-f87e055d2332/download https://cybertesis.unmsm.edu.pe/bitstreams/cb203fb6-0226-40bb-bcf2-f6e7f5ada5da/download https://cybertesis.unmsm.edu.pe/bitstreams/55db44fa-5c60-4548-9fe8-94976aecd422/download https://cybertesis.unmsm.edu.pe/bitstreams/dfb63d9d-af38-4cd8-b946-f367d585df8f/download |
| bitstream.checksum.fl_str_mv |
853a65818b35167110317cd60d078e4f 6be5756cf3dfcb4f34fd06f07ab135f5 f353bb183fccec2ed1ce14f432ebe43d bb9bdc0b3349e4284e09149f943790b4 0b3e227bcdfe85b604bc7ad06028b3da 3b6f1942575033c6bfa22f6c89b25925 319a6de455f8f17414b032b0d491b8ca f7814f05f789c27dbd27b3deb1770b5a e80277d2d8eac9d6036d6fd6a79da44d d7dc8eeb7970a9cd34dee09919f513cd |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Cybertesis UNMSM |
| repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
| _version_ |
1853595690774560768 |
| spelling |
Castañeda Vargas, Pedro SegundoMera Dávila, Luis Iván2025-08-28T13:52:26Z2025-08-28T13:52:26Z2025Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/27185Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas. Los resultados en el contexto educativo demostraron un desempeño superior a los baselines establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos computacionales evaluados. Se determinó la efectividad del modelo de machine learning para la predicción binaria de la complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo, lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado. Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Machine LearningIdentificaciónLexicografíaInteligencia artificialhttps://purl.org/pe-repo/ocde/ford#2.02.04Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarcainfo:eu-repo/semantics/masterThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDUMagíster en Ingeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y ComunicacionesUniversidad Nacional Mayor de San Marcos. Facultad de Ingeniería de Sistemas e Informática. Unidad de PosgradoIngeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y Comunicaciones10744358https://orcid.org/0000-0003-1865-129346396150612487Piedra Isusqui, Jose CésarVera Pomalaza, VirginiaAlcántara Loayza, César Augustohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALMera_dl_reportedesimilitud.pdfapplication/pdf10428376https://cybertesis.unmsm.edu.pe/bitstreams/d7865ea7-5e7a-4dfe-9d82-c8bd70ef571f/download853a65818b35167110317cd60d078e4fMD53Mera_dl_autorizacion.pdfapplication/pdf279814https://cybertesis.unmsm.edu.pe/bitstreams/0be9b67d-bb58-4ffa-9673-0cfb94b4119c/download6be5756cf3dfcb4f34fd06f07ab135f5MD54Mera_dl.pdfapplication/pdf3068732https://cybertesis.unmsm.edu.pe/bitstreams/69583442-e4ef-46fa-af21-5d73ad677cd5/downloadf353bb183fccec2ed1ce14f432ebe43dMD511LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/751408e1-0267-4790-a095-006216207b1a/downloadbb9bdc0b3349e4284e09149f943790b4MD52TEXTMera_dl_reportedesimilitud.pdf.txtMera_dl_reportedesimilitud.pdf.txtExtracted texttext/plain2672https://cybertesis.unmsm.edu.pe/bitstreams/b2ad5b4b-66e7-4c08-9d75-2a4fd4150392/download0b3e227bcdfe85b604bc7ad06028b3daMD57Mera_dl_autorizacion.pdf.txtMera_dl_autorizacion.pdf.txtExtracted texttext/plain3732https://cybertesis.unmsm.edu.pe/bitstreams/87121d6b-11b7-4bd5-ad40-21fa39418a47/download3b6f1942575033c6bfa22f6c89b25925MD59Mera_dl.pdf.txtMera_dl.pdf.txtExtracted texttext/plain101744https://cybertesis.unmsm.edu.pe/bitstreams/54256c91-57c7-417a-a465-f87e055d2332/download319a6de455f8f17414b032b0d491b8caMD512THUMBNAILMera_dl_reportedesimilitud.pdf.jpgMera_dl_reportedesimilitud.pdf.jpgGenerated Thumbnailimage/jpeg12892https://cybertesis.unmsm.edu.pe/bitstreams/cb203fb6-0226-40bb-bcf2-f6e7f5ada5da/downloadf7814f05f789c27dbd27b3deb1770b5aMD58Mera_dl_autorizacion.pdf.jpgMera_dl_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg21119https://cybertesis.unmsm.edu.pe/bitstreams/55db44fa-5c60-4548-9fe8-94976aecd422/downloade80277d2d8eac9d6036d6fd6a79da44dMD510Mera_dl.pdf.jpgMera_dl.pdf.jpgGenerated Thumbnailimage/jpeg16017https://cybertesis.unmsm.edu.pe/bitstreams/dfb63d9d-af38-4cd8-b946-f367d585df8f/downloadd7dc8eeb7970a9cd34dee09919f513cdMD51320.500.12672/27185oai:cybertesis.unmsm.edu.pe:20.500.12672/271852025-11-30 03:13:16.893https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
12.887401 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).