Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children

Descripción del Articulo

Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetiv...

Descripción completa

Detalles Bibliográficos
Autores: Calluchi Arocutipa, Britsel Milagros, Villegas Cahuana, Magaly
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/19190
Enlace del recurso:https://hdl.handle.net/20.500.12773/19190
Nivel de acceso:acceso abierto
Materia:Machine learning
Classification
Physical fitness
Schoolchildren
Hyperparamete
https://purl.org/pe-repo/ocde/ford#2.02.04
id UNSA_de935b40be95a2871458c38670776000
oai_identifier_str oai:repositorio.unsa.edu.pe:20.500.12773/19190
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
dc.title.es_PE.fl_str_mv Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
title Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
spellingShingle Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
Calluchi Arocutipa, Britsel Milagros
Machine learning
Classification
Physical fitness
Schoolchildren
Hyperparamete
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
title_full Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
title_fullStr Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
title_full_unstemmed Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
title_sort Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
author Calluchi Arocutipa, Britsel Milagros
author_facet Calluchi Arocutipa, Britsel Milagros
Villegas Cahuana, Magaly
author_role author
author2 Villegas Cahuana, Magaly
author2_role author
dc.contributor.advisor.fl_str_mv Sulla Torres, José Alfredo
dc.contributor.author.fl_str_mv Calluchi Arocutipa, Britsel Milagros
Villegas Cahuana, Magaly
dc.subject.es_PE.fl_str_mv Machine learning
Classification
Physical fitness
Schoolchildren
Hyperparamete
topic Machine learning
Classification
Physical fitness
Schoolchildren
Hyperparamete
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetivo evaluar la aptitud física mediante percentiles de las pruebas y algoritmos de machine learning con optimización de hiperparámetros. El proceso utilizado fue el de “knowledge discovery in databases” (KDD). Se recogieron datos de 1525 estudiantes (784 mujeres, 741 hombres) de 6 a 17 años, seleccionados de forma no probabilística de 5 escuelas públicas. Para la evaluación se consideraron parámetros antropométricos como edad, peso, talla, estatura sentado, circunferencia abdominal, circunferencia del brazo relajado, saturación de oxígeno, frecuencia cardíaca en reposo y flujo espiratorio máximo. Las pruebas de Aptitud Física incluyeron flexibilidad sentado, salto horizontal canguro y velocidad de vuelo de 20 metros. Dentro de los percentiles observados, tomamos tres puntos de corte como base para la presente investigación: > P75 (arriba del promedio), p25 a p75 (promedio) y < P25 (por debajo del promedio). Los siguientes algoritmos de machine learning se utilizaron para la clasificación: Random Forest, Support Vector Machine, Decision tree, Logistic Regression, Naive Bayes, K-nearest neighbor, XGBboost, Neural network, Cat Boost, LGBM y Gradient Boosting. Los algoritmos se optimizaron mediante hiperparámetros utilizando GridSearchCV para encontrar las mejores configuraciones. En conclusión, se destaca la importancia de la optimización de hiperparámetros para mejorar la precisión de los modelos de machine learning. Random Forest tiene un buen desempeño en la clasificación de las categorías “Alta” y “Baja” en la mayoría de las pruebas, pero tiene dificultades para clasificar correctamente la categoría “Normal” tanto para estudiantes masculinos como femeninos.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-12-23T18:57:27Z
dc.date.available.none.fl_str_mv 2024-12-23T18:57:27Z
dc.date.issued.fl_str_mv 2024
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12773/19190
url https://hdl.handle.net/20.500.12773/19190
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/06e3ecc6-09e9-4c24-8b60-bd3d61f04d4e/download
https://repositorio.unsa.edu.pe/bitstreams/c8a12179-901a-4552-891f-7edd289c8602/download
https://repositorio.unsa.edu.pe/bitstreams/8317ce42-520b-45bd-a337-42f0d55960c8/download
https://repositorio.unsa.edu.pe/bitstreams/597601f9-955d-4cfc-90aa-b07630d6ad0b/download
https://repositorio.unsa.edu.pe/bitstreams/4f2b2e05-49e1-4146-be90-f2858cbac7aa/download
https://repositorio.unsa.edu.pe/bitstreams/b79eb004-eedf-4f65-86b7-83e17ccd824f/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
eaa4ac57f1dcfae112ab6dd5b8fb68c9
ab57c187f168347430fe0477e4c14296
706b596a6c18e72f23c2f26df8b86088
b9eb81b65e060e060c8c1976d42d8aef
343f3502082ecfb6a39641bf5fd78cae
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv vridi.gestioninformacion@unsa.edu.pe
_version_ 1850325766429999104
spelling Sulla Torres, José AlfredoCalluchi Arocutipa, Britsel MilagrosVillegas Cahuana, Magaly2024-12-23T18:57:27Z2024-12-23T18:57:27Z2024Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetivo evaluar la aptitud física mediante percentiles de las pruebas y algoritmos de machine learning con optimización de hiperparámetros. El proceso utilizado fue el de “knowledge discovery in databases” (KDD). Se recogieron datos de 1525 estudiantes (784 mujeres, 741 hombres) de 6 a 17 años, seleccionados de forma no probabilística de 5 escuelas públicas. Para la evaluación se consideraron parámetros antropométricos como edad, peso, talla, estatura sentado, circunferencia abdominal, circunferencia del brazo relajado, saturación de oxígeno, frecuencia cardíaca en reposo y flujo espiratorio máximo. Las pruebas de Aptitud Física incluyeron flexibilidad sentado, salto horizontal canguro y velocidad de vuelo de 20 metros. Dentro de los percentiles observados, tomamos tres puntos de corte como base para la presente investigación: > P75 (arriba del promedio), p25 a p75 (promedio) y < P25 (por debajo del promedio). Los siguientes algoritmos de machine learning se utilizaron para la clasificación: Random Forest, Support Vector Machine, Decision tree, Logistic Regression, Naive Bayes, K-nearest neighbor, XGBboost, Neural network, Cat Boost, LGBM y Gradient Boosting. Los algoritmos se optimizaron mediante hiperparámetros utilizando GridSearchCV para encontrar las mejores configuraciones. En conclusión, se destaca la importancia de la optimización de hiperparámetros para mejorar la precisión de los modelos de machine learning. Random Forest tiene un buen desempeño en la clasificación de las categorías “Alta” y “Baja” en la mayoría de las pruebas, pero tiene dificultades para clasificar correctamente la categoría “Normal” tanto para estudiantes masculinos como femeninos.application/pdfhttps://hdl.handle.net/20.500.12773/19190spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAMachine learningClassificationPhysical fitnessSchoolchildrenHyperparametehttps://purl.org/pe-repo/ocde/ford#2.02.04Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged childreninfo:eu-repo/semantics/bachelorThesisSUNEDU29612305https://orcid.org/0000-0001-5129-430X7208910472291094612076Alfaro Casas, Luis AlbertoRevilla Arroyo, Christian AlainSulla Torres, José Alfredohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisIngeniería de SistemasUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosIngeniera de SistemasTesis Formato ArtículoLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unsa.edu.pe/bitstreams/06e3ecc6-09e9-4c24-8b60-bd3d61f04d4e/download8a4605be74aa9ea9d79846c1fba20a33MD52THUMBNAILPDF.jpgimage/jpeg42566https://repositorio.unsa.edu.pe/bitstreams/c8a12179-901a-4552-891f-7edd289c8602/downloadeaa4ac57f1dcfae112ab6dd5b8fb68c9MD56ORIGINALTesis Formato Artículo.pdfTesis Formato Artículo.pdfapplication/pdf1338248https://repositorio.unsa.edu.pe/bitstreams/8317ce42-520b-45bd-a337-42f0d55960c8/downloadab57c187f168347430fe0477e4c14296MD51Reporte de Similitud.pdfapplication/pdf1439846https://repositorio.unsa.edu.pe/bitstreams/597601f9-955d-4cfc-90aa-b07630d6ad0b/download706b596a6c18e72f23c2f26df8b86088MD53Autorización de Publicación Digital 01.pdfapplication/pdf350590https://repositorio.unsa.edu.pe/bitstreams/4f2b2e05-49e1-4146-be90-f2858cbac7aa/downloadb9eb81b65e060e060c8c1976d42d8aefMD54Autorización de Publicación Digital 02.pdfapplication/pdf286899https://repositorio.unsa.edu.pe/bitstreams/b79eb004-eedf-4f65-86b7-83e17ccd824f/download343f3502082ecfb6a39641bf5fd78caeMD5520.500.12773/19190oai:repositorio.unsa.edu.pe:20.500.12773/191902025-07-22 11:13:02.844http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSAvridi.gestioninformacion@unsa.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.346013
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).