Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad
Descripción del Articulo
El presente trabajo de investigación, se inicia con el estudio de la deserción estudiantil con datos recopilados de estudiantes en 10 periodos académicos del programa Computación e Informática, comprendidos entre el año 2012 y 2021 del Instituto Superior Tecnológico Trujillo. La información recopila...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad Nacional del Santa |
| Repositorio: | UNS - Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uns.edu.pe:20.500.14278/4737 |
| Enlace del recurso: | https://hdl.handle.net/20.500.14278/4737 |
| Nivel de acceso: | acceso abierto |
| Materia: | Deserción estudiantil Conjunto de datos Set de datos Aprendizaje automático supervisado Algoritmo de clasificación https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
UNSR_00e1f997ba2a0fc9353487f7890bf612 |
|---|---|
| oai_identifier_str |
oai:repositorio.uns.edu.pe:20.500.14278/4737 |
| network_acronym_str |
UNSR |
| network_name_str |
UNS - Institucional |
| repository_id_str |
3819 |
| dc.title.es_PE.fl_str_mv |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| title |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| spellingShingle |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad Polo Romero, Víctor Jaime Deserción estudiantil Conjunto de datos Set de datos Aprendizaje automático supervisado Algoritmo de clasificación https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| title_full |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| title_fullStr |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| title_full_unstemmed |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| title_sort |
Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertad |
| author |
Polo Romero, Víctor Jaime |
| author_facet |
Polo Romero, Víctor Jaime |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Gutiérrez Gutiérrez, Jorge Luis |
| dc.contributor.author.fl_str_mv |
Polo Romero, Víctor Jaime |
| dc.subject.es_PE.fl_str_mv |
Deserción estudiantil Conjunto de datos Set de datos Aprendizaje automático supervisado Algoritmo de clasificación |
| topic |
Deserción estudiantil Conjunto de datos Set de datos Aprendizaje automático supervisado Algoritmo de clasificación https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
El presente trabajo de investigación, se inicia con el estudio de la deserción estudiantil con datos recopilados de estudiantes en 10 periodos académicos del programa Computación e Informática, comprendidos entre el año 2012 y 2021 del Instituto Superior Tecnológico Trujillo. La información recopilada está compuesta de 500 registros de estudiantes. Se planteó el siguiente problema de investigación ¿Cómo obtener un modelo predictivo con mayor porcentaje de confiabilidad que los algoritmos tradicionales Bayesianos, Regresión, Soporte Vectorial y Bosques Aleatorios, para estimar la deserción estudiantil de modo más eficiente en los centros de Educación Superior Tecnológicos Públicos de la región La Libertad a través de máquinas de aprendizaje supervisados?. Se utilizó una metodología de minería de datos conocida como Crisp - DM y algoritmos de aprendizaje supervisado de la librería Scikit Learn de Python. El Tipo investigación es aplicada y diseño descriptivo. Se emplearon cuatro algoritmos de aprendizaje para ser entrenados en un conjunto de datos correspondiente al 80% del set de datos original, reservando 20% restante para la etapa de prueba del modelo final. Se obtuvo cuatro modelos, que luego de ser evaluados, se utilizaron como entradas para generar un nuevo modelo ensamblado mediante un algoritmo de votación usado para este propósito, por tener modelos heterogéneos. Se realizó en ensamble y luego de la evaluación de confiabilidad con el 20% de la data reservada para la prueba, se evidenció una confiabilidad del 93%, con una tasa de errores de 7/100 (7%), entre patrones reconocidos y no reconocidos. Se determinó el modelo ensamblado como propuesta del trabajo de investigación, aun cuando este mismo indicador se presenta en dos modelos básicos analizados; sin embargo, el modelo ensamblado, por su robustez que los caracteriza, es el que se elige como propuesta para garantizar la permanencia del índice de confiabilidad durante todo el ciclo de vida. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-08-22T16:02:23Z |
| dc.date.available.none.fl_str_mv |
2024-08-22T16:02:23Z |
| dc.date.issued.fl_str_mv |
2024-07-05 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| dc.type.version.es_PE.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
| format |
doctoralThesis |
| status_str |
acceptedVersion |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.14278/4737 |
| url |
https://hdl.handle.net/20.500.14278/4737 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional del Santa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional - UNS |
| dc.source.none.fl_str_mv |
reponame:UNS - Institucional instname:Universidad Nacional del Santa instacron:UNS |
| instname_str |
Universidad Nacional del Santa |
| instacron_str |
UNS |
| institution |
UNS |
| reponame_str |
UNS - Institucional |
| collection |
UNS - Institucional |
| bitstream.url.fl_str_mv |
http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/1/Tesis%20Polo%20Romero.pdf http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/2/Autorizaci%c3%b3n%20Polo%20Romero.pdf http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/3/Reporte%20de%20similitud%20Polo%20Romero.pdf http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/4/license.txt http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/5/Tesis%20Polo%20Romero.pdf.txt http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/7/Autorizaci%c3%b3n%20Polo%20Romero.pdf.txt http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/9/Reporte%20de%20similitud%20Polo%20Romero.pdf.txt http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/6/Tesis%20Polo%20Romero.pdf.jpg http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/8/Autorizaci%c3%b3n%20Polo%20Romero.pdf.jpg http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/10/Reporte%20de%20similitud%20Polo%20Romero.pdf.jpg |
| bitstream.checksum.fl_str_mv |
9d2ce817eece35b31b79d517ecfaba66 d6bac9358ab94d5f278fc1e2cc77e9d5 a5e414e62b871a24c1a108bc6e87e536 8a4605be74aa9ea9d79846c1fba20a33 58c564f38292e0f94512e9e3337a0649 e1c06d85ae7b8b032bef47e42e4c08f9 03f42cdbe13c9f6452514354f4877b96 25c301f324299711a23bd66a8fb801ba 6ef5e3b5dce2290e286aa8231d28a408 a1cd16c790046159b69ab7ed1550263b |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
DSpace Universidad Nacional del Santa |
| repository.mail.fl_str_mv |
repositorio@uns.edu.pe |
| _version_ |
1838823348816052224 |
| spelling |
Gutiérrez Gutiérrez, Jorge LuisPolo Romero, Víctor Jaime2024-08-22T16:02:23Z2024-08-22T16:02:23Z2024-07-05https://hdl.handle.net/20.500.14278/4737El presente trabajo de investigación, se inicia con el estudio de la deserción estudiantil con datos recopilados de estudiantes en 10 periodos académicos del programa Computación e Informática, comprendidos entre el año 2012 y 2021 del Instituto Superior Tecnológico Trujillo. La información recopilada está compuesta de 500 registros de estudiantes. Se planteó el siguiente problema de investigación ¿Cómo obtener un modelo predictivo con mayor porcentaje de confiabilidad que los algoritmos tradicionales Bayesianos, Regresión, Soporte Vectorial y Bosques Aleatorios, para estimar la deserción estudiantil de modo más eficiente en los centros de Educación Superior Tecnológicos Públicos de la región La Libertad a través de máquinas de aprendizaje supervisados?. Se utilizó una metodología de minería de datos conocida como Crisp - DM y algoritmos de aprendizaje supervisado de la librería Scikit Learn de Python. El Tipo investigación es aplicada y diseño descriptivo. Se emplearon cuatro algoritmos de aprendizaje para ser entrenados en un conjunto de datos correspondiente al 80% del set de datos original, reservando 20% restante para la etapa de prueba del modelo final. Se obtuvo cuatro modelos, que luego de ser evaluados, se utilizaron como entradas para generar un nuevo modelo ensamblado mediante un algoritmo de votación usado para este propósito, por tener modelos heterogéneos. Se realizó en ensamble y luego de la evaluación de confiabilidad con el 20% de la data reservada para la prueba, se evidenció una confiabilidad del 93%, con una tasa de errores de 7/100 (7%), entre patrones reconocidos y no reconocidos. Se determinó el modelo ensamblado como propuesta del trabajo de investigación, aun cuando este mismo indicador se presenta en dos modelos básicos analizados; sin embargo, el modelo ensamblado, por su robustez que los caracteriza, es el que se elige como propuesta para garantizar la permanencia del índice de confiabilidad durante todo el ciclo de vida.application/pdfspaUniversidad Nacional del SantaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UNSreponame:UNS - Institucionalinstname:Universidad Nacional del Santainstacron:UNS Deserción estudiantilConjunto de datosSet de datosAprendizaje automático supervisadoAlgoritmo de clasificaciónhttps://purl.org/pe-repo/ocde/ford#2.02.04Modelo predictivo basado en Machine Learning Supervised y la deserción estudiantil en centros de Educación Superior Tecnológicos Públicos de la región la Libertadinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionSUNEDUDoctor en Ingeniería de Sistemas e InformáticaUniversidad Nacional del Santa. Escuela de posgradoDoctorado en Ingeniería de Sistemas e Informáticahttps://orcid.org/0000-0002-4989-119618135227https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#doctor612028Guerra Cordero, CarlosBriones Pereyra, Lizbeth DoraGutiérrez Gutiérrez, Jorge Luis18078027ORIGINALTesis Polo Romero.pdfTesis Polo Romero.pdfapplication/pdf7587748http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/1/Tesis%20Polo%20Romero.pdf9d2ce817eece35b31b79d517ecfaba66MD51Autorización Polo Romero.pdfAutorización Polo Romero.pdfapplication/pdf684868http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/2/Autorizaci%c3%b3n%20Polo%20Romero.pdfd6bac9358ab94d5f278fc1e2cc77e9d5MD52Reporte de similitud Polo Romero.pdfReporte de similitud Polo Romero.pdfapplication/pdf19588666http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/3/Reporte%20de%20similitud%20Polo%20Romero.pdfa5e414e62b871a24c1a108bc6e87e536MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54TEXTTesis Polo Romero.pdf.txtTesis Polo Romero.pdf.txtExtracted texttext/plain172572http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/5/Tesis%20Polo%20Romero.pdf.txt58c564f38292e0f94512e9e3337a0649MD55Autorización Polo Romero.pdf.txtAutorización Polo Romero.pdf.txtExtracted texttext/plain2http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/7/Autorizaci%c3%b3n%20Polo%20Romero.pdf.txte1c06d85ae7b8b032bef47e42e4c08f9MD57Reporte de similitud Polo Romero.pdf.txtReporte de similitud Polo Romero.pdf.txtExtracted texttext/plain4415http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/9/Reporte%20de%20similitud%20Polo%20Romero.pdf.txt03f42cdbe13c9f6452514354f4877b96MD59THUMBNAILTesis Polo Romero.pdf.jpgTesis Polo Romero.pdf.jpgGenerated Thumbnailimage/jpeg6011http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/6/Tesis%20Polo%20Romero.pdf.jpg25c301f324299711a23bd66a8fb801baMD56Autorización Polo Romero.pdf.jpgAutorización Polo Romero.pdf.jpgGenerated Thumbnailimage/jpeg5501http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/8/Autorizaci%c3%b3n%20Polo%20Romero.pdf.jpg6ef5e3b5dce2290e286aa8231d28a408MD58Reporte de similitud Polo Romero.pdf.jpgReporte de similitud Polo Romero.pdf.jpgGenerated Thumbnailimage/jpeg6103http://repositorio.uns.edu.pe/bitstream/20.500.14278/4737/10/Reporte%20de%20similitud%20Polo%20Romero.pdf.jpga1cd16c790046159b69ab7ed1550263bMD51020.500.14278/4737oai:repositorio.uns.edu.pe:20.500.14278/47372024-08-22 11:10:59.174DSpace Universidad Nacional del Santarepositorio@uns.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.932913 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).