Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
Descripción del Articulo
En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el s...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2019 |
Institución: | Universidad Nacional del Centro del Perú |
Repositorio: | UNCP - Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.uncp.edu.pe:20.500.12894/5837 |
Enlace del recurso: | http://hdl.handle.net/20.500.12894/5837 |
Nivel de acceso: | acceso abierto |
Materia: | Data Science Machine learning Rendimiento académico Modelos de aprendizaje supervisados Python |
Sumario: | En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el sector educativo, de este modo es muy importante adelantarse a los hechos venideros como por ejemplo, que en una carrera universitaria la mitad de los estudiantes reprueben determinado curso y dicha información pueda ser usada para la toma de decisiones por la alta dirección de la organización. En la Facultad de Ingeniería de Sistemas existía un bajo rendimiento académico, cuya realidad se reflejaba en la desaprobación de los estudiantes en las diferentes materias de estudio, y esta situación impacta negativamente en muchos ámbitos como la empleabilidad, la obtención de becas de estudio, etc. De esta manera, el presente trabajo de investigación propuso predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú, el cual se desarrolló mediante los fundamentos de la Data Science y el tratamiento de los factores socioeconómicos y educativos de dichos estudiantes; para tal objetivo se propuso aplicar técnicas de limpieza de datos, exploración y aplicación de modelos de Machine Learning o Aprendizaje Automático, exactamente la utilización de los modelos de aprendizaje supervisado como la Regresión Logística y el Random Forest. Para este trabajo de predicción se dio a conocer el lenguaje de programación Python y la librería Scikit-Learn apoyados por las librerías de tratamiento de datos, Pandas y Numpy. Luego de esto fue necesario mostrar el comportamiento de los datos y los resultados del análisis, por lo cual se vio por conveniente el uso de representaciones gráficas estadísticas, para tal efecto se menciona el uso de la librería Matplotlib. Se concluye que el hacer uso de la teoría de la Data Science mediante el modelo aplicativo planteado, se logró el cometido que es predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).