Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú

Descripción del Articulo

En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el s...

Descripción completa

Detalles Bibliográficos
Autor: Orihuela Maita, Gerson Yovanni
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional del Centro del Perú
Repositorio:UNCP - Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uncp.edu.pe:20.500.12894/5837
Enlace del recurso:http://hdl.handle.net/20.500.12894/5837
Nivel de acceso:acceso abierto
Materia:Data Science
Machine learning
Rendimiento académico
Modelos de aprendizaje supervisados
Python
id UNCP_2de806958901e69c64a0701a393b79c0
oai_identifier_str oai:repositorio.uncp.edu.pe:20.500.12894/5837
network_acronym_str UNCP
network_name_str UNCP - Institucional
repository_id_str 4457
dc.title.es_PE.fl_str_mv Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
title Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
spellingShingle Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
Orihuela Maita, Gerson Yovanni
Data Science
Machine learning
Rendimiento académico
Modelos de aprendizaje supervisados
Python
title_short Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
title_full Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
title_fullStr Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
title_full_unstemmed Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
title_sort Aplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú
author Orihuela Maita, Gerson Yovanni
author_facet Orihuela Maita, Gerson Yovanni
author_role author
dc.contributor.advisor.fl_str_mv Peña Rojas, Anieval Cirilo
dc.contributor.author.fl_str_mv Orihuela Maita, Gerson Yovanni
dc.subject.es_PE.fl_str_mv Data Science
Machine learning
Rendimiento académico
Modelos de aprendizaje supervisados
Python
topic Data Science
Machine learning
Rendimiento académico
Modelos de aprendizaje supervisados
Python
description En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el sector educativo, de este modo es muy importante adelantarse a los hechos venideros como por ejemplo, que en una carrera universitaria la mitad de los estudiantes reprueben determinado curso y dicha información pueda ser usada para la toma de decisiones por la alta dirección de la organización. En la Facultad de Ingeniería de Sistemas existía un bajo rendimiento académico, cuya realidad se reflejaba en la desaprobación de los estudiantes en las diferentes materias de estudio, y esta situación impacta negativamente en muchos ámbitos como la empleabilidad, la obtención de becas de estudio, etc. De esta manera, el presente trabajo de investigación propuso predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú, el cual se desarrolló mediante los fundamentos de la Data Science y el tratamiento de los factores socioeconómicos y educativos de dichos estudiantes; para tal objetivo se propuso aplicar técnicas de limpieza de datos, exploración y aplicación de modelos de Machine Learning o Aprendizaje Automático, exactamente la utilización de los modelos de aprendizaje supervisado como la Regresión Logística y el Random Forest. Para este trabajo de predicción se dio a conocer el lenguaje de programación Python y la librería Scikit-Learn apoyados por las librerías de tratamiento de datos, Pandas y Numpy. Luego de esto fue necesario mostrar el comportamiento de los datos y los resultados del análisis, por lo cual se vio por conveniente el uso de representaciones gráficas estadísticas, para tal efecto se menciona el uso de la librería Matplotlib. Se concluye que el hacer uso de la teoría de la Data Science mediante el modelo aplicativo planteado, se logró el cometido que es predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2020-06-24T23:40:04Z
dc.date.available.none.fl_str_mv 2020-06-24T23:40:04Z
dc.date.issued.fl_str_mv 2019
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12894/5837
url http://hdl.handle.net/20.500.12894/5837
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Centro del Perú
dc.source.es_PE.fl_str_mv Universidad Nacional del Centro del Perú
Repositorio Institucional – UNCP
dc.source.none.fl_str_mv reponame:UNCP - Institucional
instname:Universidad Nacional del Centro del Perú
instacron:UNCP
instname_str Universidad Nacional del Centro del Perú
instacron_str UNCP
institution UNCP
reponame_str UNCP - Institucional
collection UNCP - Institucional
bitstream.url.fl_str_mv http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/4/TESIS.pdf.jpg
http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/2/license.txt
http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/1/TESIS.pdf
http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/3/TESIS.pdf.txt
bitstream.checksum.fl_str_mv ec23cd74f29c1048acafd6107cd2aae1
c52066b9c50a8f86be96c82978636682
245a69f1b914ade9bba9d18b2580a958
cddafdc4d42cca3ec951edd5222901c3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv DSpace
repository.mail.fl_str_mv repositorio@uncp.edu.pe
_version_ 1841721934459437056
spelling Peña Rojas, Anieval CiriloOrihuela Maita, Gerson Yovanni2020-06-24T23:40:04Z2020-06-24T23:40:04Z2019http://hdl.handle.net/20.500.12894/5837En la actualidad la Data Science viene siendo muy utilizada y con una tendencia de crecimiento en la extracción de conocimiento e información de los volúmenes de datos, generando diversas posibilidades para la construcción de aplicaciones en diferentes sectores; un área vital en nuestro país es el sector educativo, de este modo es muy importante adelantarse a los hechos venideros como por ejemplo, que en una carrera universitaria la mitad de los estudiantes reprueben determinado curso y dicha información pueda ser usada para la toma de decisiones por la alta dirección de la organización. En la Facultad de Ingeniería de Sistemas existía un bajo rendimiento académico, cuya realidad se reflejaba en la desaprobación de los estudiantes en las diferentes materias de estudio, y esta situación impacta negativamente en muchos ámbitos como la empleabilidad, la obtención de becas de estudio, etc. De esta manera, el presente trabajo de investigación propuso predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú, el cual se desarrolló mediante los fundamentos de la Data Science y el tratamiento de los factores socioeconómicos y educativos de dichos estudiantes; para tal objetivo se propuso aplicar técnicas de limpieza de datos, exploración y aplicación de modelos de Machine Learning o Aprendizaje Automático, exactamente la utilización de los modelos de aprendizaje supervisado como la Regresión Logística y el Random Forest. Para este trabajo de predicción se dio a conocer el lenguaje de programación Python y la librería Scikit-Learn apoyados por las librerías de tratamiento de datos, Pandas y Numpy. Luego de esto fue necesario mostrar el comportamiento de los datos y los resultados del análisis, por lo cual se vio por conveniente el uso de representaciones gráficas estadísticas, para tal efecto se menciona el uso de la librería Matplotlib. Se concluye que el hacer uso de la teoría de la Data Science mediante el modelo aplicativo planteado, se logró el cometido que es predecir el rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perú.Tesisapplication/pdfspaUniversidad Nacional del Centro del Perúinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Universidad Nacional del Centro del PerúRepositorio Institucional – UNCPreponame:UNCP - Institucionalinstname:Universidad Nacional del Centro del Perúinstacron:UNCP Data ScienceMachine learningRendimiento académicoModelos de aprendizaje supervisadosPythonAplicación de Data Science para la predicción del rendimiento académico de los estudiantes de la Facultad de Ingeniería de Sistemas de la Universidad Nacional del Centro del Perúinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de SistemasUniversidad Nacional del Centro del Perú.Facultad de Ingeniería de SistemasTitulo ProfesionalIngeniero de SistemasTHUMBNAILTESIS.pdf.jpgTESIS.pdf.jpgIM Thumbnailimage/jpeg6877http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/4/TESIS.pdf.jpgec23cd74f29c1048acafd6107cd2aae1MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81327http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/2/license.txtc52066b9c50a8f86be96c82978636682MD52ORIGINALTESIS.pdfTESIS.pdfapplication/pdf4963462http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/1/TESIS.pdf245a69f1b914ade9bba9d18b2580a958MD51TEXTTESIS.pdf.txtTESIS.pdf.txtExtracted texttext/plain172047http://repositorio.uncp.edu.pe/bitstream/20.500.12894/5837/3/TESIS.pdf.txtcddafdc4d42cca3ec951edd5222901c3MD5320.500.12894/5837oai:repositorio.uncp.edu.pe:20.500.12894/58372024-10-17 16:51:59.014DSpacerepositorio@uncp.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 12.93831
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).