Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio
Descripción del Articulo
La presente investigación propone un modelo para la automatización de predicción de la deserción de estudiantes universitarios. Esta investigación surge de una problemática existente en el sector educativo peruano: la deserción estudiantil universitaria; es decir, aquellos estudiantes universitarios...
Autores: | , |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2021 |
Institución: | Universidad Peruana de Ciencias Aplicadas |
Repositorio: | UPC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorioacademico.upc.edu.pe:10757/656740 |
Enlace del recurso: | http://hdl.handle.net/10757/656740 |
Nivel de acceso: | acceso abierto |
Materia: | Minería de datos Deserción universitaria Análisis predictivo Data mining College dropout Predictive analytics http://purl.org/pe-repo/ocde/ford#2.00.00 https://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
UUPC_d27c1da51ce99777e827e116e03f9617 |
---|---|
oai_identifier_str |
oai:repositorioacademico.upc.edu.pe:10757/656740 |
network_acronym_str |
UUPC |
network_name_str |
UPC-Institucional |
repository_id_str |
2670 |
dc.title.es_PE.fl_str_mv |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
dc.title.alternative.es_PE.fl_str_mv |
Model to automate the dropout prediction process in university students in the first year of study |
title |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
spellingShingle |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio Cevallos Medina, Erik Nicolay Minería de datos Deserción universitaria Análisis predictivo Data mining College dropout Predictive analytics http://purl.org/pe-repo/ocde/ford#2.00.00 https://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
title_full |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
title_fullStr |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
title_full_unstemmed |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
title_sort |
Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio |
author |
Cevallos Medina, Erik Nicolay |
author_facet |
Cevallos Medina, Erik Nicolay Barahona Chunga, Claudio Jorge |
author_role |
author |
author2 |
Barahona Chunga, Claudio Jorge |
author2_role |
author |
dc.contributor.advisor.fl_str_mv |
Armas Aguirre, Jimmy Alexander |
dc.contributor.author.fl_str_mv |
Cevallos Medina, Erik Nicolay Barahona Chunga, Claudio Jorge |
dc.subject.es_PE.fl_str_mv |
Minería de datos Deserción universitaria Análisis predictivo Data mining College dropout Predictive analytics |
topic |
Minería de datos Deserción universitaria Análisis predictivo Data mining College dropout Predictive analytics http://purl.org/pe-repo/ocde/ford#2.00.00 https://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.es_PE.fl_str_mv |
http://purl.org/pe-repo/ocde/ford#2.00.00 https://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
La presente investigación propone un modelo para la automatización de predicción de la deserción de estudiantes universitarios. Esta investigación surge de una problemática existente en el sector educativo peruano: la deserción estudiantil universitaria; es decir, aquellos estudiantes universitarios que abandonan sus estudios de forma parcial o definitiva. La investigación tiene por finalidad brindar una solución que contribuya a reducir la tasa de deserción universitaria, aplicando tecnologías de análisis predictivo y minería de datos, que detecte anticipadamente a estudiantes con posibilidades de abandonar sus estudios, brindando así a las instituciones educativas mayor visibilidad y oportunidades de acción ante esta problemática. Se diseñó un modelo de análisis predictivo, en base al análisis y definición de 15 variables de predicción, 3 fases y la aplicación de algoritmos de predicción, basados en la disciplina del Educational Data Minig (EDM) y soportada por la plataforma IBM SPSS Modeler. Para validar, se evaluó la aplicación de 4 algoritmos de predicción: árboles de decisión, redes bayesianas, regresión lineal y redes neuronales; en un estudio en una institución universitaria de Lima. Los resultados indican que las redes bayesianas se comportan mejor que otros algoritmos, comparados bajo las métricas de precisión, exactitud, especificidad y tasa de error. Particularmente, la precisión de las redes bayesianas alcanza un 67.10% mientras que para los árboles de decisión (el segundo mejor algoritmo) es de un 61,92% en la muestra de entrenamiento para la iteración con razón de 8:2. Además, las variables “persona deportista” (0,29%), “vivienda propia” (0,20%) y “calificaciones de preparatoria” (0,15%) son las que más contribuyen al modelo de predicción. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-07-15T18:31:04Z |
dc.date.available.none.fl_str_mv |
2021-07-15T18:31:04Z |
dc.date.issued.fl_str_mv |
2021-05-13 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.other.es_PE.fl_str_mv |
Tesis |
dc.type.coar.es_PE.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10757/656740 |
dc.identifier.isni.none.fl_str_mv |
0000 0001 2196 144X |
url |
http://hdl.handle.net/10757/656740 |
identifier_str_mv |
0000 0001 2196 144X |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.coar.es_PE.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.es_PE.fl_str_mv |
application/pdf application/epub application/msword |
dc.publisher.es_PE.fl_str_mv |
Universidad Peruana de Ciencias Aplicadas (UPC) |
dc.publisher.country.es_PE.fl_str_mv |
PE |
dc.source.es_PE.fl_str_mv |
Universidad Peruana de Ciencias Aplicadas (UPC) Repositorio Académico - UPC |
dc.source.none.fl_str_mv |
reponame:UPC-Institucional instname:Universidad Peruana de Ciencias Aplicadas instacron:UPC |
instname_str |
Universidad Peruana de Ciencias Aplicadas |
instacron_str |
UPC |
institution |
UPC |
reponame_str |
UPC-Institucional |
collection |
UPC-Institucional |
bitstream.url.fl_str_mv |
https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/8/Cevallos_ME.pdf https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/7/Cevallos_ME.pdf.jpg https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/10/Cevallos_ME_Ficha.pdf.jpg https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/6/Cevallos_ME.pdf.txt https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/9/Cevallos_ME_Ficha.pdf.txt https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/3/Cevallos_ME.pdf https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/4/Cevallos_ME.docx https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/5/Cevallos_ME_Ficha.pdf https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/2/license.txt https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/1/license_rdf |
bitstream.checksum.fl_str_mv |
946843c13e8e3f9fe331d4ec9ec61665 e6fd78498a147b8e694f9de491194399 e16ac6247116459cfd9a4ff803fe44cd cb81cf52ba674aaf81d2c38304ad976e 4b687e869ecbcb0ceb1d98ace807d911 498542367038263bc1d7fc6f142e8277 a6cb00bf882172bbc6c3a7c8d868ce5d 0d9bb7be0572578cb87e1354fbbc111e 8a4605be74aa9ea9d79846c1fba20a33 934f4ca17e109e0a05eaeaba504d7ce4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio académico upc |
repository.mail.fl_str_mv |
upc@openrepository.com |
_version_ |
1845545597505896448 |
spelling |
d0f77dcd568c9e1c4438e5c6a157914fhttp://orcid.org/0000-0002-1176-8969Armas Aguirre, Jimmy Alexanderb1a192344c3332b820dd80a5e43c36185007de5860d5b72919e6edc6a423a97e28a500Cevallos Medina, Erik NicolayBarahona Chunga, Claudio Jorge2021-07-15T18:31:04Z2021-07-15T18:31:04Z2021-05-13http://hdl.handle.net/10757/6567400000 0001 2196 144XLa presente investigación propone un modelo para la automatización de predicción de la deserción de estudiantes universitarios. Esta investigación surge de una problemática existente en el sector educativo peruano: la deserción estudiantil universitaria; es decir, aquellos estudiantes universitarios que abandonan sus estudios de forma parcial o definitiva. La investigación tiene por finalidad brindar una solución que contribuya a reducir la tasa de deserción universitaria, aplicando tecnologías de análisis predictivo y minería de datos, que detecte anticipadamente a estudiantes con posibilidades de abandonar sus estudios, brindando así a las instituciones educativas mayor visibilidad y oportunidades de acción ante esta problemática. Se diseñó un modelo de análisis predictivo, en base al análisis y definición de 15 variables de predicción, 3 fases y la aplicación de algoritmos de predicción, basados en la disciplina del Educational Data Minig (EDM) y soportada por la plataforma IBM SPSS Modeler. Para validar, se evaluó la aplicación de 4 algoritmos de predicción: árboles de decisión, redes bayesianas, regresión lineal y redes neuronales; en un estudio en una institución universitaria de Lima. Los resultados indican que las redes bayesianas se comportan mejor que otros algoritmos, comparados bajo las métricas de precisión, exactitud, especificidad y tasa de error. Particularmente, la precisión de las redes bayesianas alcanza un 67.10% mientras que para los árboles de decisión (el segundo mejor algoritmo) es de un 61,92% en la muestra de entrenamiento para la iteración con razón de 8:2. Además, las variables “persona deportista” (0,29%), “vivienda propia” (0,20%) y “calificaciones de preparatoria” (0,15%) son las que más contribuyen al modelo de predicción.This research proposes a model for the automation of prediction of university student dropout. This research arises from an existing problem in the Peruvian educational sector: university student dropout; that is, those university students who partially or permanently abandon their studies. The purpose of the research is to provide a solution that contributes to reducing the university dropout rate, applying predictive analysis technologies and data mining, which detects in advance students with the possibility of dropping out of their studies, thus providing educational institutions with greater visibility and opportunities. of action before this problem. A predictive analysis model was designed, based on the analysis and definition of 15 prediction variables, 3 phases and the application of prediction algorithms, based on the Educational Data Mining (EDM) discipline and supported by the IBM SPSS Modeler platform. To validate, the application of 4 prediction algorithms was evaluated: decision trees, Bayesian networks, linear regression, and neural networks; in a study at a university institution in Lima. The results indicate that Bayesian networks perform better than other algorithms, compared under the metrics of precision, accuracy, specificity, and error rate. Particularly, the precision of Bayesian networks reaches 67.10% while for decision trees (the second-best algorithm) it is 61.92% in the training sample for the iteration with a ratio of 8: 2. In addition, the variables "sports person" (0.29%), "own home" (0.20%) and "high school grades" (0.15%) are the ones that contribute the most to the prediction model.Tesisapplication/pdfapplication/epubapplication/mswordspaUniversidad Peruana de Ciencias Aplicadas (UPC)PEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/http://purl.org/coar/access_right/c_abf2Universidad Peruana de Ciencias Aplicadas (UPC)Repositorio Académico - UPCreponame:UPC-Institucionalinstname:Universidad Peruana de Ciencias Aplicadasinstacron:UPCMinería de datosDeserción universitariaAnálisis predictivoData miningCollege dropoutPredictive analyticshttp://purl.org/pe-repo/ocde/ford#2.00.00https://purl.org/pe-repo/ocde/ford#2.02.04Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudioModel to automate the dropout prediction process in university students in the first year of studyinfo:eu-repo/semantics/bachelorThesisTesishttp://purl.org/coar/resource_type/c_7a1fSUNEDUUniversidad Peruana de Ciencias Aplicadas (UPC). Facultad de IngenieríaLicenciaturaIngeniería de Sistemas de InformaciónIngeniero de sistemas de información2021-07-20T00:20:28Zhttps://purl.org/pe-repo/renati/type#tesishttps://orcid.org/0000-0002-1176-8969https://purl.org/pe-repo/renati/level#tituloProfesional612136CONVERTED2_37464762091-12-31Cevallos_ME.pdfCevallos_ME.pdfapplication/pdf1698579https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/8/Cevallos_ME.pdf946843c13e8e3f9fe331d4ec9ec61665MD58falseTHUMBNAILCevallos_ME.pdf.jpgCevallos_ME.pdf.jpgGenerated Thumbnailimage/jpeg30776https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/7/Cevallos_ME.pdf.jpge6fd78498a147b8e694f9de491194399MD57false2091-12-31Cevallos_ME_Ficha.pdf.jpgCevallos_ME_Ficha.pdf.jpgGenerated Thumbnailimage/jpeg35341https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/10/Cevallos_ME_Ficha.pdf.jpge16ac6247116459cfd9a4ff803fe44cdMD510falseTEXTCevallos_ME.pdf.txtCevallos_ME.pdf.txtExtracted texttext/plain113964https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/6/Cevallos_ME.pdf.txtcb81cf52ba674aaf81d2c38304ad976eMD56false2091-12-31Cevallos_ME_Ficha.pdf.txtCevallos_ME_Ficha.pdf.txtExtracted texttext/plain4https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/9/Cevallos_ME_Ficha.pdf.txt4b687e869ecbcb0ceb1d98ace807d911MD59falseORIGINALCevallos_ME.pdfCevallos_ME.pdfapplication/pdf2367126https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/3/Cevallos_ME.pdf498542367038263bc1d7fc6f142e8277MD53true2091-12-31Cevallos_ME.docxCevallos_ME.docxapplication/vnd.openxmlformats-officedocument.wordprocessingml.document1905558https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/4/Cevallos_ME.docxa6cb00bf882172bbc6c3a7c8d868ce5dMD54false2091-12-31Cevallos_ME_Ficha.pdfCevallos_ME_Ficha.pdfapplication/pdf2042425https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/5/Cevallos_ME_Ficha.pdf0d9bb7be0572578cb87e1354fbbc111eMD55falseLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52falseCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorioacademico.upc.edu.pe/bitstream/10757/656740/1/license_rdf934f4ca17e109e0a05eaeaba504d7ce4MD51false10757/656740oai:repositorioacademico.upc.edu.pe:10757/6567402025-07-20 18:58:27.548Repositorio académico upcupc@openrepository.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
12.989271 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).