Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral

Descripción del Articulo

El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo ap...

Descripción completa

Detalles Bibliográficos
Autor: Gutierrez Allende, Diego Edú
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/133719
Enlace del recurso:https://hdl.handle.net/20.500.12692/133719
Nivel de acceso:acceso abierto
Materia:Sistema inteligente
Machine learning
Stacking
Selección de variables
https://purl.org/pe-repo/ocde/ford#2.02.04
id UCVV_e8096e325295b434f680bd720d4b83d8
oai_identifier_str oai:repositorio.ucv.edu.pe:20.500.12692/133719
network_acronym_str UCVV
network_name_str UCV-Institucional
repository_id_str 3741
dc.title.es_PE.fl_str_mv Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
title Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
spellingShingle Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
Gutierrez Allende, Diego Edú
Sistema inteligente
Machine learning
Stacking
Selección de variables
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
title_full Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
title_fullStr Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
title_full_unstemmed Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
title_sort Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
author Gutierrez Allende, Diego Edú
author_facet Gutierrez Allende, Diego Edú
author_role author
dc.contributor.advisor.fl_str_mv Daza Vergaray, Alfredo
dc.contributor.author.fl_str_mv Gutierrez Allende, Diego Edú
dc.subject.es_PE.fl_str_mv Sistema inteligente
Machine learning
Stacking
Selección de variables
topic Sistema inteligente
Machine learning
Stacking
Selección de variables
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo aplicada, con una población de 310 personas con enfermedades de la columna vertebral (Hernia, espondilolistesis), además tuvo un muestreo no probabilístico. El desarrollo del sistema se da mediante el uso de la metodología KDD, en la primera fase de selección de datos, se seleccionaron las variables relevantes para la predicción de enfermedades de la columna vertebral. En la segunda fase de preprocesamiento y tercera fase de transformación de los datos, se usaron diversas técnicas para tener listos los datos e iniciar con el entrenamiento del modelo en la cuarta fase de minería de datos, dónde se entrenaron doce algoritmos de Machine Learning (DT, RF, SVM, GNB, NC, NT, NTC, K-NN, GB, XGBoost, RL, AdaBoost). Finalmente, en la fase de evaluación, se evaluó el rendimiento del modelo con las métricas de exactitud, precisión, sensibilidad, F1-score, AUC, especificidad, MCC y la función los específicamente para los algoritmos NT y NTC. Los resultados mostraron que los algoritmos AdaBoost, RF, XGBoost, SVM y NB obtuvieron resultados con un índice mayor a 80% en todas las métricas. Se concluye que el sistema desarrollado es eficaz en la predicción de enfermedades de la columna vertebral.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2024-02-20T22:19:23Z
dc.date.available.none.fl_str_mv 2024-02-20T22:19:23Z
dc.date.issued.fl_str_mv 2023
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12692/133719
url https://hdl.handle.net/20.500.12692/133719
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad César Vallejo
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - UCV
Universidad César Vallejo
dc.source.none.fl_str_mv reponame:UCV-Institucional
instname:Universidad Cesar Vallejo
instacron:UCV
instname_str Universidad Cesar Vallejo
instacron_str UCV
institution UCV
reponame_str UCV-Institucional
collection UCV-Institucional
bitstream.url.fl_str_mv https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/1/Gutierrez_ADE-SD.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/2/Gutierrez_ADE-IT.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/3/Gutierrez_ADE.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/4/license.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/5/Gutierrez_ADE-SD.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/7/Gutierrez_ADE-IT.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/9/Gutierrez_ADE.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/6/Gutierrez_ADE-SD.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/8/Gutierrez_ADE-IT.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/10/Gutierrez_ADE.pdf.jpg
bitstream.checksum.fl_str_mv 97f32fabc410cfcb7d1de916b530ba5b
0be6a9bbd24d6b4e3b791af35349549e
9c876a2944a6658aee59b3df8acaed6a
8a4605be74aa9ea9d79846c1fba20a33
ce45e0f749a8698ced0650c435a43df4
68c7f1146023a8e1a70d00bfd2ea3c81
d7c668db2d6ce342b946f3fe204e7714
6867ac8227f001053a601dd54dc7a64f
901963040b23b43dc359e31fc43b4ac3
6867ac8227f001053a601dd54dc7a64f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad César Vallejo
repository.mail.fl_str_mv repositorio@ucv.edu.pe
_version_ 1807922773116321792
spelling Daza Vergaray, AlfredoGutierrez Allende, Diego Edú2024-02-20T22:19:23Z2024-02-20T22:19:23Z2023https://hdl.handle.net/20.500.12692/133719El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo aplicada, con una población de 310 personas con enfermedades de la columna vertebral (Hernia, espondilolistesis), además tuvo un muestreo no probabilístico. El desarrollo del sistema se da mediante el uso de la metodología KDD, en la primera fase de selección de datos, se seleccionaron las variables relevantes para la predicción de enfermedades de la columna vertebral. En la segunda fase de preprocesamiento y tercera fase de transformación de los datos, se usaron diversas técnicas para tener listos los datos e iniciar con el entrenamiento del modelo en la cuarta fase de minería de datos, dónde se entrenaron doce algoritmos de Machine Learning (DT, RF, SVM, GNB, NC, NT, NTC, K-NN, GB, XGBoost, RL, AdaBoost). Finalmente, en la fase de evaluación, se evaluó el rendimiento del modelo con las métricas de exactitud, precisión, sensibilidad, F1-score, AUC, especificidad, MCC y la función los específicamente para los algoritmos NT y NTC. Los resultados mostraron que los algoritmos AdaBoost, RF, XGBoost, SVM y NB obtuvieron resultados con un índice mayor a 80% en todas las métricas. Se concluye que el sistema desarrollado es eficaz en la predicción de enfermedades de la columna vertebral.Lima NorteEscuela de Ingeniería de SistemasSistemas de Información y ComunicacionesTecnologías de la información y comunicaciónPromoción de la salud, nutrición y salud alimentariaSalud y bienestarapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVSistema inteligenteMachine learningStackingSelección de variableshttps://purl.org/pe-repo/ocde/ford#2.02.04Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebralinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de SistemasUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas40466240https://orcid.org/0000-0002-2259-107075426990612076Estrada Aro, Willabaldo MarcelinoPerez Huaman, OmarDaza Vergaray, Alfredohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALGutierrez_ADE-SD.pdfGutierrez_ADE-SD.pdfapplication/pdf10207618https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/1/Gutierrez_ADE-SD.pdf97f32fabc410cfcb7d1de916b530ba5bMD51Gutierrez_ADE-IT.pdfGutierrez_ADE-IT.pdfapplication/pdf20982469https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/2/Gutierrez_ADE-IT.pdf0be6a9bbd24d6b4e3b791af35349549eMD52Gutierrez_ADE.pdfGutierrez_ADE.pdfapplication/pdf10205742https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/3/Gutierrez_ADE.pdf9c876a2944a6658aee59b3df8acaed6aMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54TEXTGutierrez_ADE-SD.pdf.txtGutierrez_ADE-SD.pdf.txtExtracted texttext/plain328848https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/5/Gutierrez_ADE-SD.pdf.txtce45e0f749a8698ced0650c435a43df4MD55Gutierrez_ADE-IT.pdf.txtGutierrez_ADE-IT.pdf.txtExtracted texttext/plain8313https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/7/Gutierrez_ADE-IT.pdf.txt68c7f1146023a8e1a70d00bfd2ea3c81MD57Gutierrez_ADE.pdf.txtGutierrez_ADE.pdf.txtExtracted texttext/plain331199https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/9/Gutierrez_ADE.pdf.txtd7c668db2d6ce342b946f3fe204e7714MD59THUMBNAILGutierrez_ADE-SD.pdf.jpgGutierrez_ADE-SD.pdf.jpgGenerated Thumbnailimage/jpeg5105https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/6/Gutierrez_ADE-SD.pdf.jpg6867ac8227f001053a601dd54dc7a64fMD56Gutierrez_ADE-IT.pdf.jpgGutierrez_ADE-IT.pdf.jpgGenerated Thumbnailimage/jpeg6170https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/8/Gutierrez_ADE-IT.pdf.jpg901963040b23b43dc359e31fc43b4ac3MD58Gutierrez_ADE.pdf.jpgGutierrez_ADE.pdf.jpgGenerated Thumbnailimage/jpeg5105https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/10/Gutierrez_ADE.pdf.jpg6867ac8227f001053a601dd54dc7a64fMD51020.500.12692/133719oai:repositorio.ucv.edu.pe:20.500.12692/1337192024-02-20 22:13:58.347Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.958958
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).