Stacking Ensemble Machine Learning usando métodos de balanceo de datos para la predicción de enfermedades de la columna vertebral

Descripción del Articulo

El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo ap...

Descripción completa

Detalles Bibliográficos
Autor: Gutierrez Allende, Diego Edú
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/133719
Enlace del recurso:https://hdl.handle.net/20.500.12692/133719
Nivel de acceso:acceso abierto
Materia:Sistema inteligente
Machine learning
Stacking
Selección de variables
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El presente trabajo tiene como objetivo general, aplicar un sistema inteligente con ensemble machine learning con el método stacking mediante el uso de balanceo de datos que permitirá predecir enfermedades de la columna vertebral. Para ello, se realizó un estudio de enfoque cuantitativo y de tipo aplicada, con una población de 310 personas con enfermedades de la columna vertebral (Hernia, espondilolistesis), además tuvo un muestreo no probabilístico. El desarrollo del sistema se da mediante el uso de la metodología KDD, en la primera fase de selección de datos, se seleccionaron las variables relevantes para la predicción de enfermedades de la columna vertebral. En la segunda fase de preprocesamiento y tercera fase de transformación de los datos, se usaron diversas técnicas para tener listos los datos e iniciar con el entrenamiento del modelo en la cuarta fase de minería de datos, dónde se entrenaron doce algoritmos de Machine Learning (DT, RF, SVM, GNB, NC, NT, NTC, K-NN, GB, XGBoost, RL, AdaBoost). Finalmente, en la fase de evaluación, se evaluó el rendimiento del modelo con las métricas de exactitud, precisión, sensibilidad, F1-score, AUC, especificidad, MCC y la función los específicamente para los algoritmos NT y NTC. Los resultados mostraron que los algoritmos AdaBoost, RF, XGBoost, SVM y NB obtuvieron resultados con un índice mayor a 80% en todas las métricas. Se concluye que el sistema desarrollado es eficaz en la predicción de enfermedades de la columna vertebral.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).