Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset

Descripción del Articulo

Con el incremento de gestión de datos de reconocimiento de actividades humanas (HAR) que se maneja año tras año para su uso en distintas disciplinas, es importante realizar una correcta preparación de estos antes de ser utilizados para el entrenamiento de distintos modelos machine learning. El pre-p...

Descripción completa

Detalles Bibliográficos
Autor: Hidalgo Hidalgo, Natalia Elizabeth
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad de Piura
Repositorio:UDEP-Institucional
Lenguaje:español
OAI Identifier:oai:pirhua.udep.edu.pe:11042/7705
Enlace del recurso:https://hdl.handle.net/11042/7705
Nivel de acceso:acceso abierto
Materia:Procesamiento electrónico de datos -- Rendimiento -- Investigaciones
Aprendizaje automático (Inteligencia artificial) -- Investigaciones
006.31
https://purl.org/pe-repo/ocde/ford#2.11.04
id UDEP_a6410e2ad538aec6e22633f1085e8fd9
oai_identifier_str oai:pirhua.udep.edu.pe:11042/7705
network_acronym_str UDEP
network_name_str UDEP-Institucional
repository_id_str 2644
dc.title.none.fl_str_mv Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
title Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
spellingShingle Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
Hidalgo Hidalgo, Natalia Elizabeth
Procesamiento electrónico de datos -- Rendimiento -- Investigaciones
Aprendizaje automático (Inteligencia artificial) -- Investigaciones
006.31
https://purl.org/pe-repo/ocde/ford#2.11.04
title_short Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
title_full Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
title_fullStr Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
title_full_unstemmed Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
title_sort Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset
author Hidalgo Hidalgo, Natalia Elizabeth
author_facet Hidalgo Hidalgo, Natalia Elizabeth
author_role author
dc.contributor.advisor.fl_str_mv Quinde Li Say Tan, Mario José
dc.contributor.author.fl_str_mv Hidalgo Hidalgo, Natalia Elizabeth
dc.subject.none.fl_str_mv Procesamiento electrónico de datos -- Rendimiento -- Investigaciones
Aprendizaje automático (Inteligencia artificial) -- Investigaciones
topic Procesamiento electrónico de datos -- Rendimiento -- Investigaciones
Aprendizaje automático (Inteligencia artificial) -- Investigaciones
006.31
https://purl.org/pe-repo/ocde/ford#2.11.04
dc.subject.ddc.none.fl_str_mv 006.31
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.11.04
description Con el incremento de gestión de datos de reconocimiento de actividades humanas (HAR) que se maneja año tras año para su uso en distintas disciplinas, es importante realizar una correcta preparación de estos antes de ser utilizados para el entrenamiento de distintos modelos machine learning. El pre-procesamiento de datos utilizando ventanas de tiempo, el cual es utilizado para representar mejor las actividades dinámicas representadas en los datasets, no cuenta con un estudio que verifique si este tratamiento previo influye sobre el procesamiento a realizar; tratamiento que, de tener influencia sobre procesamientos futuros, podría por una parte generar modelos más efectivos con la configuración correcta o podría generar modelos con menos precisión y/o que requieran de más consumo computacional. El objetivo de este trabajo es identificar la repercusión que los parámetros de tamaño de ventanas de tiempo (window size) y porcentaje de solapamiento (overlapping) tienen sobre la precisión de modelos entrenados. Se eligió el MHEALTH dataset por su confiabilidad ya demostrada en investigaciones previas, la cantidad de datos suficiente que representa información sobre 12 tipos de actividades humanas y la inclusión de registros de 3 dispositivos ubicados en 3 partes del cuerpo. El MHEALTH dataset será sometido a distintas configuraciones de los parámetros de window size y overlapping para comprobar la influencia de los mismos sobre la precisión final. El algoritmo de machine learning con el que se realizará el procesamiento de datos será Random Forest, considerado por sus altos niveles de precisión en modelos HAR. El objetivo es obtener las métricas de precisión de cada configuración de ventanas de tiempo a estudiar. Para el análisis de los resultados de las configuraciones de ventanas de tiempo (pre procesamiento), se utilizará un submuestreo para el análisis de varianza (ANOVA), la prueba tde Student para muestras independientes, la prueba de homocedasticidad de varianzas y las pruebas de Kruskal-Wallis, Mann Whitney para reconocer las configuraciones con diferencias significativas y la influencia de los parámetros de pre-procesamiento, así como los tests de Anderson-Darling, Kolmogorov-Smirnov y Jarque-Bera para comprobar que los datos sigan una distribución normal. A través de este estudio se demuestra el impacto que tienen el tamaño de ventana y el porcentaje de solapamiento sobre la precisión de los modelos finales, evidenciando la importancia de la configuración adecuada de ventanas de tiempo al momento de realizar el pre-procesamiento de datos.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-12-03T16:32:02Z
dc.date.available.none.fl_str_mv 2025-12-03T16:32:02Z
dc.date.issued.fl_str_mv 2025-11
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.citation.none.fl_str_mv Hidalgo, N. (2025). Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset (Tesis para optar el título de Ingeniero Industrial y de Sistemas). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Industrial y de Sistemas. Piura, Perú.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/11042/7705
identifier_str_mv Hidalgo, N. (2025). Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset (Tesis para optar el título de Ingeniero Industrial y de Sistemas). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Industrial y de Sistemas. Piura, Perú.
url https://hdl.handle.net/11042/7705
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.coverage.spatial.none.fl_str_mv Perú
dc.publisher.es.fl_str_mv Universidad de Piura
dc.publisher.country.none.fl_str_mv PE
dc.source.es.fl_str_mv Universidad de Piura
Repositorio Institucional Pirhua - UDEP
dc.source.none.fl_str_mv reponame:UDEP-Institucional
instname:Universidad de Piura
instacron:UDEP
instname_str Universidad de Piura
instacron_str UDEP
institution UDEP
reponame_str UDEP-Institucional
collection UDEP-Institucional
bitstream.url.fl_str_mv https://pirhua.udep.edu.pe/backend/api/core/bitstreams/b2c8f5cc-0d63-4a9c-bfeb-5bd73fc3adfc/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5e5e1d49-8d37-4a96-b3cf-9970fecc7a44/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/c9402a41-d105-4baf-898a-698dec1b1ba3/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/e80ef1fa-3475-4385-830e-5a06b6b0b7c1/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/9286ff91-4429-40c8-840e-1c48de133f73/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7ff6176-e3b7-4a51-b39e-97b509db3cc7/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/6d905198-fb36-4319-bb7f-798b958547ff/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/e0d03d9f-db78-4ab9-b827-58259d15895f/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/cbe0f74f-09b2-4f39-8758-c161669ea610/download
https://pirhua.udep.edu.pe/backend/api/core/bitstreams/71d916cc-ec64-4710-a4ba-a1e1d22bc292/download
bitstream.checksum.fl_str_mv 7730806e945d361c54ae042a3f6a50aa
fd17410f6941ae9df0e6d016e2156b90
1ecd98baee14df4674bd178de0982b79
bb9bdc0b3349e4284e09149f943790b4
4d723fdb8ea2641525ed526678c5ec2d
e1c06d85ae7b8b032bef47e42e4c08f9
facf7c21ba5d647a8792852ad231c41c
136d891797ee4eaf5f0cc55b50f09149
0a6e578d853dcd5f862758ca184a1bc0
bd60d8b5b72a4f8b72683bb4ab9d7697
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Pirhua
repository.mail.fl_str_mv no-reply3@udep.edu.pe
_version_ 1851867140428136448
spelling Quinde Li Say Tan, Mario JoséHidalgo Hidalgo, Natalia ElizabethPerú2025-12-03T16:32:02Z2025-12-03T16:32:02Z2025-11Hidalgo, N. (2025). Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth dataset (Tesis para optar el título de Ingeniero Industrial y de Sistemas). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Industrial y de Sistemas. Piura, Perú.https://hdl.handle.net/11042/7705Con el incremento de gestión de datos de reconocimiento de actividades humanas (HAR) que se maneja año tras año para su uso en distintas disciplinas, es importante realizar una correcta preparación de estos antes de ser utilizados para el entrenamiento de distintos modelos machine learning. El pre-procesamiento de datos utilizando ventanas de tiempo, el cual es utilizado para representar mejor las actividades dinámicas representadas en los datasets, no cuenta con un estudio que verifique si este tratamiento previo influye sobre el procesamiento a realizar; tratamiento que, de tener influencia sobre procesamientos futuros, podría por una parte generar modelos más efectivos con la configuración correcta o podría generar modelos con menos precisión y/o que requieran de más consumo computacional. El objetivo de este trabajo es identificar la repercusión que los parámetros de tamaño de ventanas de tiempo (window size) y porcentaje de solapamiento (overlapping) tienen sobre la precisión de modelos entrenados. Se eligió el MHEALTH dataset por su confiabilidad ya demostrada en investigaciones previas, la cantidad de datos suficiente que representa información sobre 12 tipos de actividades humanas y la inclusión de registros de 3 dispositivos ubicados en 3 partes del cuerpo. El MHEALTH dataset será sometido a distintas configuraciones de los parámetros de window size y overlapping para comprobar la influencia de los mismos sobre la precisión final. El algoritmo de machine learning con el que se realizará el procesamiento de datos será Random Forest, considerado por sus altos niveles de precisión en modelos HAR. El objetivo es obtener las métricas de precisión de cada configuración de ventanas de tiempo a estudiar. Para el análisis de los resultados de las configuraciones de ventanas de tiempo (pre procesamiento), se utilizará un submuestreo para el análisis de varianza (ANOVA), la prueba tde Student para muestras independientes, la prueba de homocedasticidad de varianzas y las pruebas de Kruskal-Wallis, Mann Whitney para reconocer las configuraciones con diferencias significativas y la influencia de los parámetros de pre-procesamiento, así como los tests de Anderson-Darling, Kolmogorov-Smirnov y Jarque-Bera para comprobar que los datos sigan una distribución normal. A través de este estudio se demuestra el impacto que tienen el tamaño de ventana y el porcentaje de solapamiento sobre la precisión de los modelos finales, evidenciando la importancia de la configuración adecuada de ventanas de tiempo al momento de realizar el pre-procesamiento de datos.application/pdfspaUniversidad de PiuraPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad de PiuraRepositorio Institucional Pirhua - UDEPreponame:UDEP-Institucionalinstname:Universidad de Piurainstacron:UDEPProcesamiento electrónico de datos -- Rendimiento -- InvestigacionesAprendizaje automático (Inteligencia artificial) -- Investigaciones006.31https://purl.org/pe-repo/ocde/ford#2.11.04Análisis de la configuración de ventanas de tiempo para el reconocimiento de actividades humanas utilizando Random Forest en el MHealth datasetinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniero Industrial y de SistemasUniversidad de Piura. Facultad de IngenieríaIngeniería Industrial y de SistemasFacultad de IngenieríaDepartamento de Ingeniería Industrial y de SistemasÁrea de Investigación y Gestión de Operaciones72087008https://orcid.org/0000-0003-1053-1326https://orcid.org/0000-0001-6829-27064437067244727188https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional722076Sánchez Rodríguez - Morcillo, IsmaelSoto Bohórquez, Juan CarlosORIGINALING_2544.pdfING_2544.pdfArchivo principalapplication/pdf2060146https://pirhua.udep.edu.pe/backend/api/core/bitstreams/b2c8f5cc-0d63-4a9c-bfeb-5bd73fc3adfc/download7730806e945d361c54ae042a3f6a50aaMD51Autorización-Hidalgo_Hidalgo.pdfAutorización de publicaciónapplication/pdf736014https://pirhua.udep.edu.pe/backend/api/core/bitstreams/5e5e1d49-8d37-4a96-b3cf-9970fecc7a44/downloadfd17410f6941ae9df0e6d016e2156b90MD53Reporte-Hidalgo_Hidalgo.pdfReporte de turnitinapplication/pdf3607431https://pirhua.udep.edu.pe/backend/api/core/bitstreams/c9402a41-d105-4baf-898a-698dec1b1ba3/download1ecd98baee14df4674bd178de0982b79MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://pirhua.udep.edu.pe/backend/api/core/bitstreams/e80ef1fa-3475-4385-830e-5a06b6b0b7c1/downloadbb9bdc0b3349e4284e09149f943790b4MD52TEXTING_2544.pdf.txtING_2544.pdf.txtExtracted texttext/plain83733https://pirhua.udep.edu.pe/backend/api/core/bitstreams/9286ff91-4429-40c8-840e-1c48de133f73/download4d723fdb8ea2641525ed526678c5ec2dMD55Autorización-Hidalgo_Hidalgo.pdf.txtAutorización-Hidalgo_Hidalgo.pdf.txtExtracted texttext/plain2https://pirhua.udep.edu.pe/backend/api/core/bitstreams/a7ff6176-e3b7-4a51-b39e-97b509db3cc7/downloade1c06d85ae7b8b032bef47e42e4c08f9MD57Reporte-Hidalgo_Hidalgo.pdf.txtReporte-Hidalgo_Hidalgo.pdf.txtExtracted texttext/plain99383https://pirhua.udep.edu.pe/backend/api/core/bitstreams/6d905198-fb36-4319-bb7f-798b958547ff/downloadfacf7c21ba5d647a8792852ad231c41cMD59THUMBNAILING_2544.pdf.jpgING_2544.pdf.jpgGenerated Thumbnailimage/jpeg20123https://pirhua.udep.edu.pe/backend/api/core/bitstreams/e0d03d9f-db78-4ab9-b827-58259d15895f/download136d891797ee4eaf5f0cc55b50f09149MD56Autorización-Hidalgo_Hidalgo.pdf.jpgAutorización-Hidalgo_Hidalgo.pdf.jpgGenerated Thumbnailimage/jpeg33950https://pirhua.udep.edu.pe/backend/api/core/bitstreams/cbe0f74f-09b2-4f39-8758-c161669ea610/download0a6e578d853dcd5f862758ca184a1bc0MD58Reporte-Hidalgo_Hidalgo.pdf.jpgReporte-Hidalgo_Hidalgo.pdf.jpgGenerated Thumbnailimage/jpeg14714https://pirhua.udep.edu.pe/backend/api/core/bitstreams/71d916cc-ec64-4710-a4ba-a1e1d22bc292/downloadbd60d8b5b72a4f8b72683bb4ab9d7697MD51011042/7705oai:pirhua.udep.edu.pe:11042/77052025-12-05 04:31:51.327https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://pirhua.udep.edu.peRepositorio Institucional Pirhuano-reply3@udep.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.941274
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).