Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú

Descripción del Articulo

En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el s...

Descripción completa

Detalles Bibliográficos
Autor: Orihuela Maita, Gerson Yovanni
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional del Centro del Perú
Repositorio:UNCP - Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uncp.edu.pe:20.500.12894/5837
Enlace del recurso:http://hdl.handle.net/20.500.12894/5837
Nivel de acceso:acceso abierto
Materia:Data Science
Machine learning
Rendimiento académico
Modelos de aprendizaje supervisados
Python
Descripción
Sumario:En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el sector educativo, de este modo es muy importante adelantarse a los hechos venideros como por ejemplo, que en una carrera universitaria la mitad de los estudiantes reprueben determinado curso y dicha información pueda ser usada para la toma de decisiones por la alta dirección de la organización. En la Facultad de Ingeniería de Sistemas existía un bajo rendimiento académico, cuya realidad se reflejaba en la desaprobación de los estudiantes en las diferentes materias de estudio, y esta situación impacta negativamente en muchos ámbitos como la empleabilidad, la obtención de becas de estudio, etc. De esta manera, el presente trabajo de investigación propuso predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú, el cual se desarrolló mediante los fundamentos de la Data Science y el tratamiento de los factores socioeconómicos y educativos de dichos estudiantes; para tal objetivo se propuso aplicar técnicas de limpieza de datos, exploración y aplicación de modelos de Machine Learning o Aprendizaje Automático, exactamente la utilización de los modelos de aprendizaje supervisado como la Regresión Logística y el Random Forest. Para este trabajo de predicción se dio a conocer el lenguaje de programación Python y la librería Scikit-Learn apoyados por las librerías de tratamiento de datos, Pandas y Numpy. Luego de esto fue necesario mostrar el comportamiento de los datos y los resultados del análisis, por lo cual se vio por conveniente el uso de representaciones gráficas estadísticas, para tal efecto se menciona el uso de la librería Matplotlib. Se concluye que el hacer uso de la teoría de la Data Science mediante el modelo aplicativo planteado, se logró el cometido que es predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).