Modelos de machine learning para predecir el no logro de sustentación de tesis al año de egresado en una universidad pública del Perú
Descripción del Articulo
El objetivo fue identificar el modelo que predice el no logro de sustentación de tesis al año de egreso en la Facultad de Zootecnia–UNCP. Se analizó una cohorte de 67 egresados, con variables académicas (PPA, TDP, repitencias), personales (motivación, estado emocional, eventos familiares), socioecon...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2026 |
| Institución: | Universidad Nacional de Huancavelica |
| Repositorio: | UNH-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unh.edu.pe:20.500.14597/26911 |
| Enlace del recurso: | https://hdl.handle.net/20.500.14597/26911 |
| Nivel de acceso: | acceso abierto |
| Materia: | Machine learning Random Forest Sustentación de tesis Predicción académica https://purl.org/pe-repo/ocde/ford#5.03.00 |
| Sumario: | El objetivo fue identificar el modelo que predice el no logro de sustentación de tesis al año de egreso en la Facultad de Zootecnia–UNCP. Se analizó una cohorte de 67 egresados, con variables académicas (PPA, TDP, repitencias), personales (motivación, estado emocional, eventos familiares), socioeconómicas (ingresos, apoyo familiar) e institucionales (investigación, tutorías, apoyo del asesor). Las variables continuas se estandarizaron; los ítems Likert se codificaron con one-hot; las dicotómicas se mantuvieron sin transformación. Se compararon Regresión Logística, Random Forest, Gradient Boosting, Árbol de Decisión y SVM-RBF. Con validación estratificada 70/30, se evaluaron AUC, accuracy, F1, recall, precision y métricas de error (MSE, CV). Random Forest mostró el mejor desempeño (AUC=0.79; accuracy=0.76; F1=0.71), con IC bootstrap [0.544–0.959] sobre el azar. La Regresión Logística alcanzó AUC=0.764 y alta precisión para la clase positiva, con sensibilidad moderada. SVM-RBF, Gradient Boosting y Árbol de Decisión tuvieron rendimientos menores. La importancia de variables destacó duración del pregrado, ingreso familiar, pérdida de un familiar, participación en investigación, motivación y apoyo del asesor como predictores-clave. Se concluye que Random-Forest es la herramienta más fiable y que intervenciones focalizadas en acortar el pregrado, fortalecer la motivación y mejorar el acompañamiento académico podrían aumentar las tasas de sustentación. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).