Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral
Descripción del Articulo
El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo ap...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2023 |
Institución: | Universidad Cesar Vallejo |
Repositorio: | UCV-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.ucv.edu.pe:20.500.12692/133719 |
Enlace del recurso: | https://hdl.handle.net/20.500.12692/133719 |
Nivel de acceso: | acceso abierto |
Materia: | Sistema inteligente Machine learning Stacking Selección de variables https://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
UCVV_e8096e325295b434f680bd720d4b83d8 |
---|---|
oai_identifier_str |
oai:repositorio.ucv.edu.pe:20.500.12692/133719 |
network_acronym_str |
UCVV |
network_name_str |
UCV-Institucional |
repository_id_str |
3741 |
dc.title.es_PE.fl_str_mv |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
title |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
spellingShingle |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral Gutierrez Allende, Diego Edú Sistema inteligente Machine learning Stacking Selección de variables https://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
title_full |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
title_fullStr |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
title_full_unstemmed |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
title_sort |
Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral |
author |
Gutierrez Allende, Diego Edú |
author_facet |
Gutierrez Allende, Diego Edú |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Daza Vergaray, Alfredo |
dc.contributor.author.fl_str_mv |
Gutierrez Allende, Diego Edú |
dc.subject.es_PE.fl_str_mv |
Sistema inteligente Machine learning Stacking Selección de variables |
topic |
Sistema inteligente Machine learning Stacking Selección de variables https://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo aplicada, con una población de 310 personas con enfermedades de la columna vertebral (Hernia, espondilolistesis), además tuvo un muestreo no probabilístico. El desarrollo del sistema se da mediante el uso de la metodología KDD, en la primera fase de selección de datos, se seleccionaron las variables relevantes para la predicción de enfermedades de la columna vertebral. En la segunda fase de preprocesamiento y tercera fase de transformación de los datos, se usaron diversas técnicas para tener listos los datos e iniciar con el entrenamiento del modelo en la cuarta fase de minería de datos, dónde se entrenaron doce algoritmos de Machine Learning (DT, RF, SVM, GNB, NC, NT, NTC, K-NN, GB, XGBoost, RL, AdaBoost). Finalmente, en la fase de evaluación, se evaluó el rendimiento del modelo con las métricas de exactitud, precisión, sensibilidad, F1-score, AUC, especificidad, MCC y la función los específicamente para los algoritmos NT y NTC. Los resultados mostraron que los algoritmos AdaBoost, RF, XGBoost, SVM y NB obtuvieron resultados con un índice mayor a 80% en todas las métricas. Se concluye que el sistema desarrollado es eficaz en la predicción de enfermedades de la columna vertebral. |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2024-02-20T22:19:23Z |
dc.date.available.none.fl_str_mv |
2024-02-20T22:19:23Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12692/133719 |
url |
https://hdl.handle.net/20.500.12692/133719 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad César Vallejo |
dc.publisher.country.es_PE.fl_str_mv |
PE |
dc.source.es_PE.fl_str_mv |
Repositorio Institucional - UCV Universidad César Vallejo |
dc.source.none.fl_str_mv |
reponame:UCV-Institucional instname:Universidad Cesar Vallejo instacron:UCV |
instname_str |
Universidad Cesar Vallejo |
instacron_str |
UCV |
institution |
UCV |
reponame_str |
UCV-Institucional |
collection |
UCV-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/1/Gutierrez_ADE-SD.pdf https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/2/Gutierrez_ADE-IT.pdf https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/3/Gutierrez_ADE.pdf https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/4/license.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/5/Gutierrez_ADE-SD.pdf.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/7/Gutierrez_ADE-IT.pdf.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/9/Gutierrez_ADE.pdf.txt https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/6/Gutierrez_ADE-SD.pdf.jpg https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/8/Gutierrez_ADE-IT.pdf.jpg https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/10/Gutierrez_ADE.pdf.jpg |
bitstream.checksum.fl_str_mv |
97f32fabc410cfcb7d1de916b530ba5b 0be6a9bbd24d6b4e3b791af35349549e 9c876a2944a6658aee59b3df8acaed6a 8a4605be74aa9ea9d79846c1fba20a33 ce45e0f749a8698ced0650c435a43df4 68c7f1146023a8e1a70d00bfd2ea3c81 d7c668db2d6ce342b946f3fe204e7714 6867ac8227f001053a601dd54dc7a64f 901963040b23b43dc359e31fc43b4ac3 6867ac8227f001053a601dd54dc7a64f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio de la Universidad César Vallejo |
repository.mail.fl_str_mv |
repositorio@ucv.edu.pe |
_version_ |
1807922773116321792 |
spelling |
Daza Vergaray, AlfredoGutierrez Allende, Diego Edú2024-02-20T22:19:23Z2024-02-20T22:19:23Z2023https://hdl.handle.net/20.500.12692/133719El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo aplicada, con una población de 310 personas con enfermedades de la columna vertebral (Hernia, espondilolistesis), además tuvo un muestreo no probabilístico. El desarrollo del sistema se da mediante el uso de la metodología KDD, en la primera fase de selección de datos, se seleccionaron las variables relevantes para la predicción de enfermedades de la columna vertebral. En la segunda fase de preprocesamiento y tercera fase de transformación de los datos, se usaron diversas técnicas para tener listos los datos e iniciar con el entrenamiento del modelo en la cuarta fase de minería de datos, dónde se entrenaron doce algoritmos de Machine Learning (DT, RF, SVM, GNB, NC, NT, NTC, K-NN, GB, XGBoost, RL, AdaBoost). Finalmente, en la fase de evaluación, se evaluó el rendimiento del modelo con las métricas de exactitud, precisión, sensibilidad, F1-score, AUC, especificidad, MCC y la función los específicamente para los algoritmos NT y NTC. Los resultados mostraron que los algoritmos AdaBoost, RF, XGBoost, SVM y NB obtuvieron resultados con un índice mayor a 80% en todas las métricas. Se concluye que el sistema desarrollado es eficaz en la predicción de enfermedades de la columna vertebral.Lima NorteEscuela de Ingeniería de SistemasSistemas de Información y ComunicacionesTecnologías de la información y comunicaciónPromoción de la salud, nutrición y salud alimentariaSalud y bienestarapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVSistema inteligenteMachine learningStackingSelección de variableshttps://purl.org/pe-repo/ocde/ford#2.02.04Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebralinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de SistemasUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniero de Sistemas40466240https://orcid.org/0000-0002-2259-107075426990612076Estrada Aro, Willabaldo MarcelinoPerez Huaman, OmarDaza Vergaray, Alfredohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALGutierrez_ADE-SD.pdfGutierrez_ADE-SD.pdfapplication/pdf10207618https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/1/Gutierrez_ADE-SD.pdf97f32fabc410cfcb7d1de916b530ba5bMD51Gutierrez_ADE-IT.pdfGutierrez_ADE-IT.pdfapplication/pdf20982469https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/2/Gutierrez_ADE-IT.pdf0be6a9bbd24d6b4e3b791af35349549eMD52Gutierrez_ADE.pdfGutierrez_ADE.pdfapplication/pdf10205742https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/3/Gutierrez_ADE.pdf9c876a2944a6658aee59b3df8acaed6aMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54TEXTGutierrez_ADE-SD.pdf.txtGutierrez_ADE-SD.pdf.txtExtracted texttext/plain328848https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/5/Gutierrez_ADE-SD.pdf.txtce45e0f749a8698ced0650c435a43df4MD55Gutierrez_ADE-IT.pdf.txtGutierrez_ADE-IT.pdf.txtExtracted texttext/plain8313https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/7/Gutierrez_ADE-IT.pdf.txt68c7f1146023a8e1a70d00bfd2ea3c81MD57Gutierrez_ADE.pdf.txtGutierrez_ADE.pdf.txtExtracted texttext/plain331199https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/9/Gutierrez_ADE.pdf.txtd7c668db2d6ce342b946f3fe204e7714MD59THUMBNAILGutierrez_ADE-SD.pdf.jpgGutierrez_ADE-SD.pdf.jpgGenerated Thumbnailimage/jpeg5105https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/6/Gutierrez_ADE-SD.pdf.jpg6867ac8227f001053a601dd54dc7a64fMD56Gutierrez_ADE-IT.pdf.jpgGutierrez_ADE-IT.pdf.jpgGenerated Thumbnailimage/jpeg6170https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/8/Gutierrez_ADE-IT.pdf.jpg901963040b23b43dc359e31fc43b4ac3MD58Gutierrez_ADE.pdf.jpgGutierrez_ADE.pdf.jpgGenerated Thumbnailimage/jpeg5105https://repositorio.ucv.edu.pe/bitstream/20.500.12692/133719/10/Gutierrez_ADE.pdf.jpg6867ac8227f001053a601dd54dc7a64fMD51020.500.12692/133719oai:repositorio.ucv.edu.pe:20.500.12692/1337192024-02-20 22:13:58.347Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.958958 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).