Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca

Descripción del Articulo

Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dat...

Descripción completa

Detalles Bibliográficos
Autor: Mera Dávila, Luis Iván
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/27185
Enlace del recurso:https://hdl.handle.net/20.500.12672/27185
Nivel de acceso:acceso abierto
Materia:Machine Learning
Identificación
Lexicografía
Inteligencia artificial
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:Determina la efectividad de un modelo propuesto de machine learning para predecir binariamente la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task 2018 para el idioma español. La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas. Los resultados en el contexto educativo demostraron un desempeño superior a los baselines establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos computacionales evaluados. Se determinó la efectividad del modelo de machine learning para la predicción binaria de la complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo, lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado. Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).