Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima
Descripción del Articulo
La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se uti...
Autores: | , |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2020 |
Institución: | Universidad Peruana Unión |
Repositorio: | UPEU-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.upeu.edu.pe:20.500.12840/4202 |
Enlace del recurso: | http://repositorio.upeu.edu.pe/handle/20.500.12840/4202 |
Nivel de acceso: | acceso abierto |
Materia: | Modelo predictivo Machine learning Desercion estudiantil XGBOOST Árbol de clasificación http://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se utilizó el método de CRISP-DM para el desarrollo del modelo. Los datos fueron extraídos del sistema académico de la Universidad Peruana Unión considerando el período 2009-2019. Estos fueron clasificados en factores personales, financieros y académicos, siendo un total de 3161 registros. La metodología del estudio contó con 6 etapas: Comprensión del negocio, comprensión de los datos, preparación de los datos, diseño del modelo, evaluación del modelo y la implementación del modelo. A partir del análisis de las 16 variables iniciales y la transformación realizada, se obtuvo un diccionario de datos con 26 variables. Con este diccionario de datos se procedió a la identificación de las técnicas de modelos de aprendizaje para cada carrera, del cual se obtuvo que Decision Tree, Naive Bayes, KNN y Random Forest, fueron los que se adaptaron mejor a la realidad de cada carrera. Al evaluar estos modelos con las métricas “ratio de verdaderos positivos” (TPR) y “balanced accuracy”, se obtuvo que el modelo eficaz para cada carrera fue: Ing. Sistemas (Random Forest), Ing. Civil (Decision Tree), Ing. Alimentos (KNN), Ing. Ambiental (KNN) y Arquitectura (KNN). Finalmente, estos modelos fueron implementados en un API REST, en el cual se demostró su funcionamiento para realizar futuras predicciones de deserción estudiantes, sin necesidad de volver a entrenar el modelo. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).