Implementación de un método de clasificación para detectar la deserción de estudiantes de la carrera de Ingeniería de Industrias Alimentarias de una Universidad Nacional Peruana basado en aprendizaje de maquina

Descripción del Articulo

La deserción estudiantil es un problema creciente en Latinoamérica, con un aumento considerable en los últimos años. Esto ha tenido un impacto económico significativo, con pérdidas que alcanzan el 26% del gasto público en educación. En Perú, entre 40,000 y 50,000 universitarios abandonan sus estudio...

Descripción completa

Detalles Bibliográficos
Autores: Campos Barrera, Sandro Paul, Pastor Oliva, Cesar Augusto
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/12096
Enlace del recurso:https://hdl.handle.net/20.500.12802/12096
Nivel de acceso:acceso abierto
Materia:Deserción estudiantil
Algoritmos de predicción
Métodos de clasificación
Aprendizaje de Máquina
Filtros supervisados
Filtros de balanceo
RandomFores
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:La deserción estudiantil es un problema creciente en Latinoamérica, con un aumento considerable en los últimos años. Esto ha tenido un impacto económico significativo, con pérdidas que alcanzan el 26% del gasto público en educación. En Perú, entre 40,000 y 50,000 universitarios abandonan sus estudios anualmente. Asimismo, la pandemia de COVID-19 agravó la deserción, pasando del 12% en 2019 al 18.6% en 2020. Para abordar este problema, se han realizado estudios que utilizan algoritmos de clasificación, como Máquina de Vectores de Soporte, Naive Bayes, Perceptrón Multicapa y Árboles de Decisión, para predecir la deserción estudiantil. Aún ante la efectividad de los métodos, la creciente deserción requería una mayor precisión. Siendo así, esta investigación propone implementar un método de clasificación mejorado utilizando algoritmos de Aprendizaje de Máquina como Random Forest, Naive Bayes, J48, RandomTree y Support Vector Machine. Se mejoró la calidad de los datos mediante filtros supervisados y no supervisados, como ReplaceMissingValues para completar datos faltantes, SpreadSubSample, Resample y Class Balancer para equilibrar clases y validación cruzada para evaluar el desempeño de cada algoritmo propuesto. El método propuesto, junto con el algoritmo Support Vector Machine, logró una precisión del 98.88% al procesar una muestra de 358 instancias. Se demostró que eliminar datos faltantes puede reducir el rendimiento de los algoritmos clasificadores, y se usó el filtro ReplaceMissingValues para llenar los valores faltantes con la media aritmética. Este enfoque muestra un prometedor avance en la predicción de la deserción estudiantil y puede ser una herramienta valiosa para las instituciones educativas en la lucha contra este problema
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).