Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca

Descripción del Articulo

Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dat...

Descripción completa

Detalles Bibliográficos
Autor: Mera Dávila, Luis Iván
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/27185
Enlace del recurso:https://hdl.handle.net/20.500.12672/27185
Nivel de acceso:acceso abierto
Materia:Machine Learning
Identificación
Lexicografía
Inteligencia artificial
https://purl.org/pe-repo/ocde/ford#2.02.04
id UNMS_b2bbc2eaa803c7cb93e79a87b8260684
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/27185
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.none.fl_str_mv Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
title Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
spellingShingle Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
Mera Dávila, Luis Iván
Machine Learning
Identificación
Lexicografía
Inteligencia artificial
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
title_full Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
title_fullStr Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
title_full_unstemmed Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
title_sort Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
author Mera Dávila, Luis Iván
author_facet Mera Dávila, Luis Iván
author_role author
dc.contributor.advisor.fl_str_mv Castañeda Vargas, Pedro Segundo
dc.contributor.author.fl_str_mv Mera Dávila, Luis Iván
dc.subject.none.fl_str_mv Machine Learning
Identificación
Lexicografía
Inteligencia artificial
topic Machine Learning
Identificación
Lexicografía
Inteligencia artificial
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas. Los resultados en el contexto educativo demostraron un desempeño superior a los baselines establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos computacionales evaluados. Se determinó la efectividad del modelo de machine learning para la predicción binaria de la complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo, lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado. Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-08-28T13:52:26Z
dc.date.available.none.fl_str_mv 2025-08-28T13:52:26Z
dc.date.issued.fl_str_mv 2025
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.citation.none.fl_str_mv Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/27185
identifier_str_mv Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.
url https://hdl.handle.net/20.500.12672/27185
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/b765ce6e-c746-4a88-b0a1-04ee58e2d748/download
https://cybertesis.unmsm.edu.pe/bitstreams/d7865ea7-5e7a-4dfe-9d82-c8bd70ef571f/download
https://cybertesis.unmsm.edu.pe/bitstreams/0be9b67d-bb58-4ffa-9673-0cfb94b4119c/download
https://cybertesis.unmsm.edu.pe/bitstreams/751408e1-0267-4790-a095-006216207b1a/download
https://cybertesis.unmsm.edu.pe/bitstreams/e0ee8963-1904-4ba6-86e2-d605cfc3fe97/download
https://cybertesis.unmsm.edu.pe/bitstreams/b2ad5b4b-66e7-4c08-9d75-2a4fd4150392/download
https://cybertesis.unmsm.edu.pe/bitstreams/87121d6b-11b7-4bd5-ad40-21fa39418a47/download
https://cybertesis.unmsm.edu.pe/bitstreams/9c73eab8-31b1-426e-bc27-410a95ec74fe/download
https://cybertesis.unmsm.edu.pe/bitstreams/cb203fb6-0226-40bb-bcf2-f6e7f5ada5da/download
https://cybertesis.unmsm.edu.pe/bitstreams/55db44fa-5c60-4548-9fe8-94976aecd422/download
bitstream.checksum.fl_str_mv 2bdb780ef8465073d0c2ad8bc9c491b5
853a65818b35167110317cd60d078e4f
6be5756cf3dfcb4f34fd06f07ab135f5
bb9bdc0b3349e4284e09149f943790b4
333e757a726d600b0833b25efb55fea2
0b3e227bcdfe85b604bc7ad06028b3da
3b6f1942575033c6bfa22f6c89b25925
276c81a9d9d282e7606f89047726cf82
f7814f05f789c27dbd27b3deb1770b5a
e80277d2d8eac9d6036d6fd6a79da44d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1844716265201991680
spelling Castañeda Vargas, Pedro SegundoMera Dávila, Luis Iván2025-08-28T13:52:26Z2025-08-28T13:52:26Z2025Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/27185Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas. Los resultados en el contexto educativo demostraron un desempeño superior a los baselines establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos computacionales evaluados. Se determinó la efectividad del modelo de machine learning para la predicción binaria de la complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo, lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado. Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Machine LearningIdentificaciónLexicografíaInteligencia artificialhttps://purl.org/pe-repo/ocde/ford#2.02.04Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarcainfo:eu-repo/semantics/masterThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDUMagíster en Ingeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y ComunicacionesUniversidad Nacional Mayor de San Marcos. Facultad de Ingeniería de Sistemas e Informática. Unidad de PosgradoIngeniería de Sistemas e Informática con mención en Gestión de Tecnología de Información y Comunicaciones10744358https://orcid.org/0000-0003-1865-129346396150612487Piedra Isusqui, Jose CésarVera Pomalaza, VirginiaAlcántara Loayza, César Augustohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALMera_dl.pdfMera_dl.pdfapplication/pdf3344140https://cybertesis.unmsm.edu.pe/bitstreams/b765ce6e-c746-4a88-b0a1-04ee58e2d748/download2bdb780ef8465073d0c2ad8bc9c491b5MD51Mera_dl_reportedesimilitud.pdfapplication/pdf10428376https://cybertesis.unmsm.edu.pe/bitstreams/d7865ea7-5e7a-4dfe-9d82-c8bd70ef571f/download853a65818b35167110317cd60d078e4fMD53Mera_dl_autorizacion.pdfapplication/pdf279814https://cybertesis.unmsm.edu.pe/bitstreams/0be9b67d-bb58-4ffa-9673-0cfb94b4119c/download6be5756cf3dfcb4f34fd06f07ab135f5MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/751408e1-0267-4790-a095-006216207b1a/downloadbb9bdc0b3349e4284e09149f943790b4MD52TEXTMera_dl.pdf.txtMera_dl.pdf.txtExtracted texttext/plain101735https://cybertesis.unmsm.edu.pe/bitstreams/e0ee8963-1904-4ba6-86e2-d605cfc3fe97/download333e757a726d600b0833b25efb55fea2MD55Mera_dl_reportedesimilitud.pdf.txtMera_dl_reportedesimilitud.pdf.txtExtracted texttext/plain2672https://cybertesis.unmsm.edu.pe/bitstreams/b2ad5b4b-66e7-4c08-9d75-2a4fd4150392/download0b3e227bcdfe85b604bc7ad06028b3daMD57Mera_dl_autorizacion.pdf.txtMera_dl_autorizacion.pdf.txtExtracted texttext/plain3732https://cybertesis.unmsm.edu.pe/bitstreams/87121d6b-11b7-4bd5-ad40-21fa39418a47/download3b6f1942575033c6bfa22f6c89b25925MD59THUMBNAILMera_dl.pdf.jpgMera_dl.pdf.jpgGenerated Thumbnailimage/jpeg16014https://cybertesis.unmsm.edu.pe/bitstreams/9c73eab8-31b1-426e-bc27-410a95ec74fe/download276c81a9d9d282e7606f89047726cf82MD56Mera_dl_reportedesimilitud.pdf.jpgMera_dl_reportedesimilitud.pdf.jpgGenerated Thumbnailimage/jpeg12892https://cybertesis.unmsm.edu.pe/bitstreams/cb203fb6-0226-40bb-bcf2-f6e7f5ada5da/downloadf7814f05f789c27dbd27b3deb1770b5aMD58Mera_dl_autorizacion.pdf.jpgMera_dl_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg21119https://cybertesis.unmsm.edu.pe/bitstreams/55db44fa-5c60-4548-9fe8-94976aecd422/downloade80277d2d8eac9d6036d6fd6a79da44dMD51020.500.12672/27185oai:cybertesis.unmsm.edu.pe:20.500.12672/271852025-08-31 03:27:05.279https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.78023
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).