Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima
Descripción del Articulo
La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se uti...
Autores: | , |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2020 |
Institución: | Universidad Peruana Unión |
Repositorio: | UPEU-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.upeu.edu.pe:20.500.12840/4202 |
Enlace del recurso: | http://repositorio.upeu.edu.pe/handle/20.500.12840/4202 |
Nivel de acceso: | acceso abierto |
Materia: | Modelo predictivo Machine learning Desercion estudiantil XGBOOST Árbol de clasificación http://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
UEPU_728799a087eba7f1db8a898326bbc867 |
---|---|
oai_identifier_str |
oai:repositorio.upeu.edu.pe:20.500.12840/4202 |
network_acronym_str |
UEPU |
network_name_str |
UPEU-Tesis |
repository_id_str |
4840 |
dc.title.en_ES.fl_str_mv |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
title |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
spellingShingle |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima Baldoceda Ramírez, Anthony Jose Modelo predictivo Machine learning Desercion estudiantil XGBOOST Árbol de clasificación http://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
title_full |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
title_fullStr |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
title_full_unstemmed |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
title_sort |
Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Lima |
author |
Baldoceda Ramírez, Anthony Jose |
author_facet |
Baldoceda Ramírez, Anthony Jose Mamani Ccallohuari, Hector Armando |
author_role |
author |
author2 |
Mamani Ccallohuari, Hector Armando |
author2_role |
author |
dc.contributor.advisor.fl_str_mv |
Saboya Ríos, Nemias |
dc.contributor.author.fl_str_mv |
Baldoceda Ramírez, Anthony Jose Mamani Ccallohuari, Hector Armando |
dc.subject.en_ES.fl_str_mv |
Modelo predictivo Machine learning Desercion estudiantil XGBOOST Árbol de clasificación |
topic |
Modelo predictivo Machine learning Desercion estudiantil XGBOOST Árbol de clasificación http://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.en_ES.fl_str_mv |
http://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se utilizó el método de CRISP-DM para el desarrollo del modelo. Los datos fueron extraídos del sistema académico de la Universidad Peruana Unión considerando el período 2009-2019. Estos fueron clasificados en factores personales, financieros y académicos, siendo un total de 3161 registros. La metodología del estudio contó con 6 etapas: Comprensión del negocio, comprensión de los datos, preparación de los datos, diseño del modelo, evaluación del modelo y la implementación del modelo. A partir del análisis de las 16 variables iniciales y la transformación realizada, se obtuvo un diccionario de datos con 26 variables. Con este diccionario de datos se procedió a la identificación de las técnicas de modelos de aprendizaje para cada carrera, del cual se obtuvo que Decision Tree, Naive Bayes, KNN y Random Forest, fueron los que se adaptaron mejor a la realidad de cada carrera. Al evaluar estos modelos con las métricas “ratio de verdaderos positivos” (TPR) y “balanced accuracy”, se obtuvo que el modelo eficaz para cada carrera fue: Ing. Sistemas (Random Forest), Ing. Civil (Decision Tree), Ing. Alimentos (KNN), Ing. Ambiental (KNN) y Arquitectura (KNN). Finalmente, estos modelos fueron implementados en un API REST, en el cual se demostró su funcionamiento para realizar futuras predicciones de deserción estudiantes, sin necesidad de volver a entrenar el modelo. |
publishDate |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-02-09T20:29:12Z |
dc.date.available.none.fl_str_mv |
2021-02-09T20:29:12Z |
dc.date.issued.fl_str_mv |
2020-10-09 |
dc.type.en_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
http://repositorio.upeu.edu.pe/handle/20.500.12840/4202 |
url |
http://repositorio.upeu.edu.pe/handle/20.500.12840/4202 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.en_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by/3.0/es/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/3.0/es/ |
dc.format.en_ES.fl_str_mv |
application/pdf |
dc.publisher.en_ES.fl_str_mv |
Universidad Peruana Unión |
dc.publisher.country.en_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:UPEU-Tesis instname:Universidad Peruana Unión instacron:UPEU |
instname_str |
Universidad Peruana Unión |
instacron_str |
UPEU |
institution |
UPEU |
reponame_str |
UPEU-Tesis |
collection |
UPEU-Tesis |
bitstream.url.fl_str_mv |
https://repositorio.upeu.edu.pe/bitstreams/ee91a0de-7791-4c3d-ae26-bfabe1717e8b/download https://repositorio.upeu.edu.pe/bitstreams/de334940-c9df-4603-8b20-41cbfc942774/download https://repositorio.upeu.edu.pe/bitstreams/4f8cd33c-e648-4d50-938b-b126fc9dada6/download https://repositorio.upeu.edu.pe/bitstreams/01572985-3e2e-4ca5-a41c-20ce7eb8a9a4/download |
bitstream.checksum.fl_str_mv |
ff28a15b31d8b36d045b61ef83195dd0 8a4605be74aa9ea9d79846c1fba20a33 cc199ce04063f658e6896527548e7f4c 31708491d106933e6630a659aa4a2214 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
DSpace 7 |
repository.mail.fl_str_mv |
repositorio-help@upeu.edu.pe |
_version_ |
1835737606302728192 |
spelling |
Saboya Ríos, NemiasBaldoceda Ramírez, Anthony JoseMamani Ccallohuari, Hector Armando2021-02-09T20:29:12Z2021-02-09T20:29:12Z2020-10-09http://repositorio.upeu.edu.pe/handle/20.500.12840/4202La presente investigación tiene como principal objetivo determinar el nivel de eficacia del modelo de aprendizaje supervisado para el pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión – Lima. El estudio fue de tipo aplicada y se utilizó el método de CRISP-DM para el desarrollo del modelo. Los datos fueron extraídos del sistema académico de la Universidad Peruana Unión considerando el período 2009-2019. Estos fueron clasificados en factores personales, financieros y académicos, siendo un total de 3161 registros. La metodología del estudio contó con 6 etapas: Comprensión del negocio, comprensión de los datos, preparación de los datos, diseño del modelo, evaluación del modelo y la implementación del modelo. A partir del análisis de las 16 variables iniciales y la transformación realizada, se obtuvo un diccionario de datos con 26 variables. Con este diccionario de datos se procedió a la identificación de las técnicas de modelos de aprendizaje para cada carrera, del cual se obtuvo que Decision Tree, Naive Bayes, KNN y Random Forest, fueron los que se adaptaron mejor a la realidad de cada carrera. Al evaluar estos modelos con las métricas “ratio de verdaderos positivos” (TPR) y “balanced accuracy”, se obtuvo que el modelo eficaz para cada carrera fue: Ing. Sistemas (Random Forest), Ing. Civil (Decision Tree), Ing. Alimentos (KNN), Ing. Ambiental (KNN) y Arquitectura (KNN). Finalmente, estos modelos fueron implementados en un API REST, en el cual se demostró su funcionamiento para realizar futuras predicciones de deserción estudiantes, sin necesidad de volver a entrenar el modelo.LIMAEscuela Profesional de Ingeniería de SistemasGestión e Innovación de Tecnologíaapplication/pdfspaUniversidad Peruana UniónPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/3.0/es/Modelo predictivoMachine learningDesercion estudiantilXGBOOSTÁrbol de clasificaciónhttp://purl.org/pe-repo/ocde/ford#2.02.04Modelo de aprendizaje supervisado para pronóstico de la deserción de estudiantes de la Facultad de Ingeniería y Arquitectura de la Universidad Peruana Unión - Limainfo:eu-repo/semantics/bachelorThesisreponame:UPEU-Tesisinstname:Universidad Peruana Unióninstacron:UPEUSUNEDUIngeniería de SistemasUniversidad Peruana Unión. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas42001721https://orcid.org/0000-0002-7166-21977524964477270544612076Acuña Salinas, Erika InésAlvizuri Llerena, Geraldine VerónicaHuanca Torres, Fredy AbelPaucar Curasma, HerminioSaboya Rios, Nemiashttp://purl.org/pe-repo/renati/nivel#tituloProfesionalhttp://purl.org/pe-repo/renati/type#tesisCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.upeu.edu.pe/bitstreams/ee91a0de-7791-4c3d-ae26-bfabe1717e8b/downloadff28a15b31d8b36d045b61ef83195dd0MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.upeu.edu.pe/bitstreams/de334940-c9df-4603-8b20-41cbfc942774/download8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALAnthony_Tesis_Licenciatura_2020.pdfAnthony_Tesis_Licenciatura_2020.pdfapplication/pdf6172994https://repositorio.upeu.edu.pe/bitstreams/4f8cd33c-e648-4d50-938b-b126fc9dada6/downloadcc199ce04063f658e6896527548e7f4cMD54THUMBNAILAnthony_Tesis_Licenciatura_2020.pdf.jpgAnthony_Tesis_Licenciatura_2020.pdf.jpgGenerated Thumbnailimage/jpeg3628https://repositorio.upeu.edu.pe/bitstreams/01572985-3e2e-4ca5-a41c-20ce7eb8a9a4/download31708491d106933e6630a659aa4a2214MD5520.500.12840/4202oai:repositorio.upeu.edu.pe:20.500.12840/42022024-10-22 17:30:10.497http://creativecommons.org/licenses/by/3.0/es/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.upeu.edu.peDSpace 7repositorio-help@upeu.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.871978 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).