Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima

Descripción del Articulo

La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se uti...

Descripción completa

Detalles Bibliográficos
Autores: Baldoceda Ramírez, Anthony Jose, Mamani Ccallohuari, Hector Armando
Formato: tesis de grado
Fecha de Publicación:2020
Institución:Universidad Peruana Unión
Repositorio:UPEU-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.upeu.edu.pe:20.500.12840/4202
Enlace del recurso:http://repositorio.upeu.edu.pe/handle/20.500.12840/4202
Nivel de acceso:acceso abierto
Materia:Modelo predictivo
Machine learning
Desercion estudiantil
XGBOOST
Árbol de clasificación
http://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se utilizó el método de CRISP-DM para el desarrollo del modelo. Los datos fueron extraídos del sistema académico de la Universidad Peruana Unión considerando el período 2009-2019. Estos fueron clasificados en factores personales, financieros y académicos, siendo un total de 3161 registros. La metodología del estudio contó con 6 etapas: Comprensión del negocio, comprensión de los datos, preparación de los datos, diseño del modelo, evaluación del modelo y la implementación del modelo. A partir del análisis de las 16 variables iniciales y la transformación realizada, se obtuvo un diccionario de datos con 26 variables. Con este diccionario de datos se procedió a la identificación de las técnicas de modelos de aprendizaje para cada carrera, del cual se obtuvo que Decision Tree, Naive Bayes, KNN y Random Forest, fueron los que se adaptaron mejor a la realidad de cada carrera. Al evaluar estos modelos con las métricas “ratio de verdaderos positivos” (TPR) y “balanced accuracy”, se obtuvo que el modelo eficaz para cada carrera fue: Ing. Sistemas (Random Forest), Ing. Civil (Decision Tree), Ing. Alimentos (KNN), Ing. Ambiental (KNN) y Arquitectura (KNN). Finalmente, estos modelos fueron implementados en un API REST, en el cual se demostró su funcionamiento para realizar futuras predicciones de deserción estudiantes, sin necesidad de volver a entrenar el modelo.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).