Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children

Descripción del Articulo

Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetiv...

Descripción completa

Detalles Bibliográficos
Autores: Calluchi Arocutipa, Britsel Milagros, Villegas Cahuana, Magaly
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/19190
Enlace del recurso:https://hdl.handle.net/20.500.12773/19190
Nivel de acceso:acceso abierto
Materia:Machine learning
Classification
Physical fitness
Schoolchildren
Hyperparamete
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetivo evaluar la aptitud física mediante percentiles de las pruebas y algoritmos de machine learning con optimización de hiperparámetros. El proceso utilizado fue el de “knowledge discovery in databases” (KDD). Se recogieron datos de 1525 estudiantes (784 mujeres, 741 hombres) de 6 a 17 años, seleccionados de forma no probabilística de 5 escuelas públicas. Para la evaluación se consideraron parámetros antropométricos como edad, peso, talla, estatura sentado, circunferencia abdominal, circunferencia del brazo relajado, saturación de oxígeno, frecuencia cardíaca en reposo y flujo espiratorio máximo. Las pruebas de Aptitud Física incluyeron flexibilidad sentado, salto horizontal canguro y velocidad de vuelo de 20 metros. Dentro de los percentiles observados, tomamos tres puntos de corte como base para la presente investigación: > P75 (arriba del promedio), p25 a p75 (promedio) y < P25 (por debajo del promedio). Los siguientes algoritmos de machine learning se utilizaron para la clasificación: Random Forest, Support Vector Machine, Decision tree, Logistic Regression, Naive Bayes, K-nearest neighbor, XGBboost, Neural network, Cat Boost, LGBM y Gradient Boosting. Los algoritmos se optimizaron mediante hiperparámetros utilizando GridSearchCV para encontrar las mejores configuraciones. En conclusión, se destaca la importancia de la optimización de hiperparámetros para mejorar la precisión de los modelos de machine learning. Random Forest tiene un buen desempeño en la clasificación de las categorías “Alta” y “Baja” en la mayoría de las pruebas, pero tiene dificultades para clasificar correctamente la categoría “Normal” tanto para estudiantes masculinos como femeninos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).