Modelo de Regresión Logístico en datos no balanceados para predecir la reincorporación de alumnos ausentes en la Universidad Continental
Descripción del Articulo
Aplica la metodología Undersampling a un conjunto de datos desbalanceados de alumnos en condición de ausencia para ver su impacto en las predicciones hechas por el Modelo de Regresión Logística. Se utiliza un conjunto de datos de alumnos en condición de ausencia de la Universidad Continental, en el...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/21266 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/21266 |
| Nivel de acceso: | acceso abierto |
| Materia: | Estudiantes Asistencia a la universidad Estadística - Metodología https://purl.org/pe-repo/ocde/ford#1.01.03 |
| Sumario: | Aplica la metodología Undersampling a un conjunto de datos desbalanceados de alumnos en condición de ausencia para ver su impacto en las predicciones hechas por el Modelo de Regresión Logística. Se utiliza un conjunto de datos de alumnos en condición de ausencia de la Universidad Continental, en el cual se necesita saber qué alumnos se reincorporarán en el periodo 2023-2. Se observa que la gran mayoría no se reincorpora, ya que dicho porcentaje es del 90% aproximadamente según la información histórica que maneja la universidad. Es decir; se evidencia un desbalance de clases en la variable respuesta. La reincorporación estudiantil universitaria es el retorno del alumno a su centro de estudios luego que dicho alumno se ausentó de la universidad. Se utiliza la lista de alumnos ausentes al cerrarse la matrícula del 2022-1, donde el estado de reincorporación es la variable respuesta la cual se conoce en el cierre de matrícula del siguiente periodo académico (2022-2) y la cual es desbalanceada. Con dicha información consolidada se construye un modelo de Regresión Logística tradicional y otro aplicando la metodología Undersampling, la cual es útil para corregir el desbalance y generar mejores predicciones, que es lo que se muestra en este trabajo al comparar sus resultados con los resultados del modelo cuando no se utiliza dicha metodología. Lo anteriormente descrito es propio de un enfoque cuantitativo, además de tener las características de un diseño no experimental dado que no se manipulan las variables independientes. Después de obtener y comprar resultados se decidirá sí se va a utilizar dicha metodología para elaborar predicciones para el 2023-2. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).