Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children
Descripción del Articulo
Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetiv...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/19190 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12773/19190 |
| Nivel de acceso: | acceso abierto |
| Materia: | Machine learning Classification Physical fitness Schoolchildren Hyperparamete https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
UNSA_de935b40be95a2871458c38670776000 |
|---|---|
| oai_identifier_str |
oai:repositorio.unsa.edu.pe:20.500.12773/19190 |
| network_acronym_str |
UNSA |
| network_name_str |
UNSA-Institucional |
| repository_id_str |
4847 |
| dc.title.es_PE.fl_str_mv |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| title |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| spellingShingle |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children Calluchi Arocutipa, Britsel Milagros Machine learning Classification Physical fitness Schoolchildren Hyperparamete https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| title_full |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| title_fullStr |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| title_full_unstemmed |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| title_sort |
Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged children |
| author |
Calluchi Arocutipa, Britsel Milagros |
| author_facet |
Calluchi Arocutipa, Britsel Milagros Villegas Cahuana, Magaly |
| author_role |
author |
| author2 |
Villegas Cahuana, Magaly |
| author2_role |
author |
| dc.contributor.advisor.fl_str_mv |
Sulla Torres, José Alfredo |
| dc.contributor.author.fl_str_mv |
Calluchi Arocutipa, Britsel Milagros Villegas Cahuana, Magaly |
| dc.subject.es_PE.fl_str_mv |
Machine learning Classification Physical fitness Schoolchildren Hyperparamete |
| topic |
Machine learning Classification Physical fitness Schoolchildren Hyperparamete https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetivo evaluar la aptitud física mediante percentiles de las pruebas y algoritmos de machine learning con optimización de hiperparámetros. El proceso utilizado fue el de “knowledge discovery in databases” (KDD). Se recogieron datos de 1525 estudiantes (784 mujeres, 741 hombres) de 6 a 17 años, seleccionados de forma no probabilística de 5 escuelas públicas. Para la evaluación se consideraron parámetros antropométricos como edad, peso, talla, estatura sentado, circunferencia abdominal, circunferencia del brazo relajado, saturación de oxígeno, frecuencia cardíaca en reposo y flujo espiratorio máximo. Las pruebas de Aptitud Física incluyeron flexibilidad sentado, salto horizontal canguro y velocidad de vuelo de 20 metros. Dentro de los percentiles observados, tomamos tres puntos de corte como base para la presente investigación: > P75 (arriba del promedio), p25 a p75 (promedio) y < P25 (por debajo del promedio). Los siguientes algoritmos de machine learning se utilizaron para la clasificación: Random Forest, Support Vector Machine, Decision tree, Logistic Regression, Naive Bayes, K-nearest neighbor, XGBboost, Neural network, Cat Boost, LGBM y Gradient Boosting. Los algoritmos se optimizaron mediante hiperparámetros utilizando GridSearchCV para encontrar las mejores configuraciones. En conclusión, se destaca la importancia de la optimización de hiperparámetros para mejorar la precisión de los modelos de machine learning. Random Forest tiene un buen desempeño en la clasificación de las categorías “Alta” y “Baja” en la mayoría de las pruebas, pero tiene dificultades para clasificar correctamente la categoría “Normal” tanto para estudiantes masculinos como femeninos. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-12-23T18:57:27Z |
| dc.date.available.none.fl_str_mv |
2024-12-23T18:57:27Z |
| dc.date.issued.fl_str_mv |
2024 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12773/19190 |
| url |
https://hdl.handle.net/20.500.12773/19190 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
| dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
| instname_str |
Universidad Nacional de San Agustín |
| instacron_str |
UNSA |
| institution |
UNSA |
| reponame_str |
UNSA-Institucional |
| collection |
UNSA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/06e3ecc6-09e9-4c24-8b60-bd3d61f04d4e/download https://repositorio.unsa.edu.pe/bitstreams/c8a12179-901a-4552-891f-7edd289c8602/download https://repositorio.unsa.edu.pe/bitstreams/8317ce42-520b-45bd-a337-42f0d55960c8/download https://repositorio.unsa.edu.pe/bitstreams/597601f9-955d-4cfc-90aa-b07630d6ad0b/download https://repositorio.unsa.edu.pe/bitstreams/4f2b2e05-49e1-4146-be90-f2858cbac7aa/download https://repositorio.unsa.edu.pe/bitstreams/b79eb004-eedf-4f65-86b7-83e17ccd824f/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 eaa4ac57f1dcfae112ab6dd5b8fb68c9 ab57c187f168347430fe0477e4c14296 706b596a6c18e72f23c2f26df8b86088 b9eb81b65e060e060c8c1976d42d8aef 343f3502082ecfb6a39641bf5fd78cae |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UNSA |
| repository.mail.fl_str_mv |
vridi.gestioninformacion@unsa.edu.pe |
| _version_ |
1850325766429999104 |
| spelling |
Sulla Torres, José AlfredoCalluchi Arocutipa, Britsel MilagrosVillegas Cahuana, Magaly2024-12-23T18:57:27Z2024-12-23T18:57:27Z2024Realizar la clasificación mediante algoritmos machine learning en las pruebas de aptitud física que se llevan a cabo a los estudiantes en los centros educativos puede contribuir significativamente a la prevención de la obesidad y otras enfermedades relacionadas. Esta investigación tiene como objetivo evaluar la aptitud física mediante percentiles de las pruebas y algoritmos de machine learning con optimización de hiperparámetros. El proceso utilizado fue el de “knowledge discovery in databases” (KDD). Se recogieron datos de 1525 estudiantes (784 mujeres, 741 hombres) de 6 a 17 años, seleccionados de forma no probabilística de 5 escuelas públicas. Para la evaluación se consideraron parámetros antropométricos como edad, peso, talla, estatura sentado, circunferencia abdominal, circunferencia del brazo relajado, saturación de oxígeno, frecuencia cardíaca en reposo y flujo espiratorio máximo. Las pruebas de Aptitud Física incluyeron flexibilidad sentado, salto horizontal canguro y velocidad de vuelo de 20 metros. Dentro de los percentiles observados, tomamos tres puntos de corte como base para la presente investigación: > P75 (arriba del promedio), p25 a p75 (promedio) y < P25 (por debajo del promedio). Los siguientes algoritmos de machine learning se utilizaron para la clasificación: Random Forest, Support Vector Machine, Decision tree, Logistic Regression, Naive Bayes, K-nearest neighbor, XGBboost, Neural network, Cat Boost, LGBM y Gradient Boosting. Los algoritmos se optimizaron mediante hiperparámetros utilizando GridSearchCV para encontrar las mejores configuraciones. En conclusión, se destaca la importancia de la optimización de hiperparámetros para mejorar la precisión de los modelos de machine learning. Random Forest tiene un buen desempeño en la clasificación de las categorías “Alta” y “Baja” en la mayoría de las pruebas, pero tiene dificultades para clasificar correctamente la categoría “Normal” tanto para estudiantes masculinos como femeninos.application/pdfhttps://hdl.handle.net/20.500.12773/19190spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAMachine learningClassificationPhysical fitnessSchoolchildrenHyperparametehttps://purl.org/pe-repo/ocde/ford#2.02.04Optimizing hyperparameters in machine learning models for accurate fitness activity classification in school-aged childreninfo:eu-repo/semantics/bachelorThesisSUNEDU29612305https://orcid.org/0000-0001-5129-430X7208910472291094612076Alfaro Casas, Luis AlbertoRevilla Arroyo, Christian AlainSulla Torres, José Alfredohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisIngeniería de SistemasUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosIngeniera de SistemasTesis Formato ArtículoLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unsa.edu.pe/bitstreams/06e3ecc6-09e9-4c24-8b60-bd3d61f04d4e/download8a4605be74aa9ea9d79846c1fba20a33MD52THUMBNAILPDF.jpgimage/jpeg42566https://repositorio.unsa.edu.pe/bitstreams/c8a12179-901a-4552-891f-7edd289c8602/downloadeaa4ac57f1dcfae112ab6dd5b8fb68c9MD56ORIGINALTesis Formato Artículo.pdfTesis Formato Artículo.pdfapplication/pdf1338248https://repositorio.unsa.edu.pe/bitstreams/8317ce42-520b-45bd-a337-42f0d55960c8/downloadab57c187f168347430fe0477e4c14296MD51Reporte de Similitud.pdfapplication/pdf1439846https://repositorio.unsa.edu.pe/bitstreams/597601f9-955d-4cfc-90aa-b07630d6ad0b/download706b596a6c18e72f23c2f26df8b86088MD53Autorización de Publicación Digital 01.pdfapplication/pdf350590https://repositorio.unsa.edu.pe/bitstreams/4f2b2e05-49e1-4146-be90-f2858cbac7aa/downloadb9eb81b65e060e060c8c1976d42d8aefMD54Autorización de Publicación Digital 02.pdfapplication/pdf286899https://repositorio.unsa.edu.pe/bitstreams/b79eb004-eedf-4f65-86b7-83e17ccd824f/download343f3502082ecfb6a39641bf5fd78caeMD5520.500.12773/19190oai:repositorio.unsa.edu.pe:20.500.12773/191902025-07-22 11:13:02.844http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSAvridi.gestioninformacion@unsa.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.346013 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).