Modelos de machine learning para predecir el no logro de sustentación de tesis al año de egresado en una universidad pública del Perú

Descripción del Articulo

El objetivo fue identificar el modelo que predice el no logro de sustentación de tesis al año de egreso en la Facultad de Zootecnia–UNCP. Se analizó una cohorte de 67 egresados, con variables académicas (PPA, TDP, repitencias), personales (motivación, estado emocional, eventos familiares), socioecon...

Descripción completa

Detalles Bibliográficos
Autor: Ninahuanca Carhuas, Jordan Oscar
Formato: tesis de maestría
Fecha de Publicación:2026
Institución:Universidad Nacional de Huancavelica
Repositorio:UNH-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unh.edu.pe:20.500.14597/26911
Enlace del recurso:https://hdl.handle.net/20.500.14597/26911
Nivel de acceso:acceso abierto
Materia:Machine learning
Random Forest
Sustentación de tesis
Predicción académica
https://purl.org/pe-repo/ocde/ford#5.03.00
Descripción
Sumario:El objetivo fue identificar el modelo que predice el no logro de sustentación de tesis al año de egreso en la Facultad de Zootecnia–UNCP. Se analizó una cohorte de 67 egresados, con variables académicas (PPA, TDP, repitencias), personales (motivación, estado emocional, eventos familiares), socioeconómicas (ingresos, apoyo familiar) e institucionales (investigación, tutorías, apoyo del asesor). Las variables continuas se estandarizaron; los ítems Likert se codificaron con one-hot; las dicotómicas se mantuvieron sin transformación. Se compararon Regresión Logística, Random Forest, Gradient Boosting, Árbol de Decisión y SVM-RBF. Con validación estratificada 70/30, se evaluaron AUC, accuracy, F1, recall, precision y métricas de error (MSE, CV). Random Forest mostró el mejor desempeño (AUC=0.79; accuracy=0.76; F1=0.71), con IC bootstrap [0.544–0.959] sobre el azar. La Regresión Logística alcanzó AUC=0.764 y alta precisión para la clase positiva, con sensibilidad moderada. SVM-RBF, Gradient Boosting y Árbol de Decisión tuvieron rendimientos menores. La importancia de variables destacó duración del pregrado, ingreso familiar, pérdida de un familiar, participación en investigación, motivación y apoyo del asesor como predictores-clave. Se concluye que Random-Forest es la herramienta más fiable y que intervenciones focalizadas en acortar el pregrado, fortalecer la motivación y mejorar el acompañamiento académico podrían aumentar las tasas de sustentación.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).