Predicción de la ruta de rendimiento académico con algoritmos de clasificación
Descripción del Articulo
La presente investigación tiene como objetivo determinar la ruta de rendimiento académico de los estudiantes ingresantes de Ingeniería de Sistemas. La ruta de rendimiento académico está definida por tres cursos, los cuales representan cursos críticos para ser aprobados por los estudiantes. Los datos...
Autor: | |
---|---|
Formato: | tesis doctoral |
Fecha de Publicación: | 2023 |
Institución: | Universidad Nacional de San Agustín |
Repositorio: | UNSA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/16154 |
Enlace del recurso: | https://hdl.handle.net/20.500.12773/16154 |
Nivel de acceso: | acceso abierto |
Materia: | Rendimiento Académico Aprendizaje Supervisado Minería de Datos CRISP-DM Algoritmos de Clasificación https://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | La presente investigación tiene como objetivo determinar la ruta de rendimiento académico de los estudiantes ingresantes de Ingeniería de Sistemas. La ruta de rendimiento académico está definida por tres cursos, los cuales representan cursos críticos para ser aprobados por los estudiantes. Los datos utilizados en la investigación están conformados por datos de admisión y datos académicos de los estudiantes registrados desde el año 2010 al 2020 de la Universidad Nacional de San Agustín de Arequipa, el cual ascienden a un total de 827 estudiantes. Se abordó la investigación desde un enfoque cuantitativo, no experimental y nivel correlacional. El desarrollo de la propuesta está basado en algoritmos de clasificación supervisados, donde se ha desarrollado las fases de un proceso de minería de datos con la metodología denominada Proceso Estándar Inter-Industrias para Minería de Datos. Se han implementado modelos de clasificación binario usando los algoritmos de regresión logística, random forest, máquinas de soporte vectorial y xgboost. Se han seleccionado los mejores modelos clasificadores en base a los valores de las métricas obtenidas. Además, se ha reducido la dimensionalidad de los datos, ya que se ha trabajado en algunos modelos con las variables más influyentes o determinantes en los resultados. Se ha mostrado que las variables más influyentes o determinantes en el proceso de predicción son puntaje de ingreso a la universidad, edad a la que egreso del colegio, edad a la que ingresó a la universidad y tiempo transcurrido entre edad de egreso y edad de ingreso. Se han construido tres modelos para predecir el estado (aprueba/desaprueba el curso) del estudiante y tres modelos para predecir el número de matrícula (aprobó el curso en una matrícula o en más de una matrícula). Los resultados muestran que cada uno de los modelos alcanza una precisión entre un 87% y 93% en la predicción, de manera temprana de cómo será el rendimiento académico de los estudiantes ingresantes, obteniendo como conclusión que los algoritmos de clasificación permiten predecir el rendimiento académico. Se busca que la información obtenida en la investigación sea útil para que las instituciones educativas implementen programas de tutoría y seguimiento a los posibles estudiantes que desaprueben los cursos y más aún que muestren señales que abandonen la carrera. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).