Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023

Descripción del Articulo

En años recientes, la ausencia de sistemas automatizados en la predicción de la calidad del agua ha ocasionado retrasos significativos en la obtención de datos precisos, lo cual ha impactado la fiabilidad de los cálculos y ha elevado los costos asociados a todo el proceso. La investigación está enfo...

Descripción completa

Detalles Bibliográficos
Autor: Cazasola Cuno, Zhaida Yoshy
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/145196
Enlace del recurso:https://hdl.handle.net/20.500.12692/145196
Nivel de acceso:acceso abierto
Materia:Random forest
Métricas
Python
https://purl.org/pe-repo/ocde/ford#2.07.00
id UCVV_7162985c4c3366ff5554e22cb4867b54
oai_identifier_str oai:repositorio.ucv.edu.pe:20.500.12692/145196
network_acronym_str UCVV
network_name_str UCV-Institucional
repository_id_str 3741
dc.title.es_PE.fl_str_mv Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
title Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
spellingShingle Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
Cazasola Cuno, Zhaida Yoshy
Random forest
Métricas
Python
https://purl.org/pe-repo/ocde/ford#2.07.00
title_short Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
title_full Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
title_fullStr Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
title_full_unstemmed Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
title_sort Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023
author Cazasola Cuno, Zhaida Yoshy
author_facet Cazasola Cuno, Zhaida Yoshy
author_role author
dc.contributor.advisor.fl_str_mv Sernaque Auccahuasi, Fernando Antonio
dc.contributor.author.fl_str_mv Cazasola Cuno, Zhaida Yoshy
dc.subject.es_PE.fl_str_mv Random forest
Métricas
Python
topic Random forest
Métricas
Python
https://purl.org/pe-repo/ocde/ford#2.07.00
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.07.00
description En años recientes, la ausencia de sistemas automatizados en la predicción de la calidad del agua ha ocasionado retrasos significativos en la obtención de datos precisos, lo cual ha impactado la fiabilidad de los cálculos y ha elevado los costos asociados a todo el proceso. La investigación está enfocada en desarrollar modelos de aprendizaje automático para automatizar el sistema para predecir calidad del agua en la cuenca de Azángaro. Los datos se consultaron de la base de datos que cuenta la institución nacional SNIRH de Perú dentro de la temática calidad del agua, obteniendo un total de 136 muestras, donde la metodología empleada para el desarrollo del modelo fue, recolección de datos históricos, selección de parámetros, procesamiento y limpieza de datos, división de datos (prueba - entrenamiento), entrenamiento del modelo y finalmente la etapa de validación de cada modelo, en este punto es donde se evaluó el rendimiento de que tan bien puede predecir cada modelo la calidad del agua. Los resultados fueron, de los 5 modelos de predicción desarrollados, Random Forest (RF) seguido de Decisión Trees (DTs) lograron un buen rendimiento en métricas de evaluación, en el modelo Random Forest se obtuvo un Root Mean Squared Error (RMSE) de 3.354, Mean Squared Error (MSE) de 12.886, un Mean Absolute Error (MAE) de 2.563 y Coefficient of Determination (R2) de 0.613. Por ende, se concluye que el desarrollo de este modelo presenta un desempeño óptimo para la predicción de la calidad del agua.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-11T16:58:10Z
dc.date.available.none.fl_str_mv 2024-07-11T16:58:10Z
dc.date.issued.fl_str_mv 2024
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12692/145196
url https://hdl.handle.net/20.500.12692/145196
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad César Vallejo
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - UCV
Universidad César Vallejo
dc.source.none.fl_str_mv reponame:UCV-Institucional
instname:Universidad Cesar Vallejo
instacron:UCV
instname_str Universidad Cesar Vallejo
instacron_str UCV
institution UCV
reponame_str UCV-Institucional
collection UCV-Institucional
bitstream.url.fl_str_mv https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/1/Cazasola_CZY-SD.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/2/Cazasola_CZY-IT.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/3/Cazasola_CZY.pdf
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/4/license.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/5/Cazasola_CZY-SD.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/7/Cazasola_CZY-IT.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/9/Cazasola_CZY.pdf.txt
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/6/Cazasola_CZY-SD.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/8/Cazasola_CZY-IT.pdf.jpg
https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/10/Cazasola_CZY.pdf.jpg
bitstream.checksum.fl_str_mv d248d4319e8fa1dc67c328e4f9dd1d50
53792d749997050f56f3fa27dbcf2024
b9a000fd67545b91f64882fa314d0626
8a4605be74aa9ea9d79846c1fba20a33
bf9a122fdd3f033dcb83be330f8036bb
f2b51cd0c0321cafa819db666c1ad05a
428ade94597f894b0371ecd7cde52ea6
0feb30be31a0a181b60ac9e8834d2c55
8b1f36ed4dc97639ff1375c48e701d0a
0feb30be31a0a181b60ac9e8834d2c55
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad César Vallejo
repository.mail.fl_str_mv repositorio@ucv.edu.pe
_version_ 1807923456714473472
spelling Sernaque Auccahuasi, Fernando AntonioCazasola Cuno, Zhaida Yoshy2024-07-11T16:58:10Z2024-07-11T16:58:10Z2024https://hdl.handle.net/20.500.12692/145196En años recientes, la ausencia de sistemas automatizados en la predicción de la calidad del agua ha ocasionado retrasos significativos en la obtención de datos precisos, lo cual ha impactado la fiabilidad de los cálculos y ha elevado los costos asociados a todo el proceso. La investigación está enfocada en desarrollar modelos de aprendizaje automático para automatizar el sistema para predecir calidad del agua en la cuenca de Azángaro. Los datos se consultaron de la base de datos que cuenta la institución nacional SNIRH de Perú dentro de la temática calidad del agua, obteniendo un total de 136 muestras, donde la metodología empleada para el desarrollo del modelo fue, recolección de datos históricos, selección de parámetros, procesamiento y limpieza de datos, división de datos (prueba - entrenamiento), entrenamiento del modelo y finalmente la etapa de validación de cada modelo, en este punto es donde se evaluó el rendimiento de que tan bien puede predecir cada modelo la calidad del agua. Los resultados fueron, de los 5 modelos de predicción desarrollados, Random Forest (RF) seguido de Decisión Trees (DTs) lograron un buen rendimiento en métricas de evaluación, en el modelo Random Forest se obtuvo un Root Mean Squared Error (RMSE) de 3.354, Mean Squared Error (MSE) de 12.886, un Mean Absolute Error (MAE) de 2.563 y Coefficient of Determination (R2) de 0.613. Por ende, se concluye que el desarrollo de este modelo presenta un desempeño óptimo para la predicción de la calidad del agua.Lima NorteEscuela de Ingeniería AmbientalCalidad y Gestión de los Recursos NaturalesDesarrollo sostenible, emprendimientos y responsabilidad social.Desarrollo económico, empleo y emprendimientoAcción por el climaPRESENCIALapplication/pdfspaUniversidad César VallejoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio Institucional - UCVUniversidad César Vallejoreponame:UCV-Institucionalinstname:Universidad Cesar Vallejoinstacron:UCVRandom forestMétricasPythonhttps://purl.org/pe-repo/ocde/ford#2.07.00Desarrollo de modelos de machine learning para la predicción de la calidad del agua utilizando datos históricos, Cuenca Azángaro – 2023info:eu-repo/semantics/bachelorThesisSUNEDUIngeniería AmbientalUniversidad César Vallejo. Facultad de Ingeniería y ArquitecturaIngeniera Ambiental07268863https://orcid.org/0000-0003-1485-585471477959521066Montalvo Morales, Kenny RubenLozano Sulca, Yimi TomSernaque Auccahuasi, Fernando Antoniohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALCazasola_CZY-SD.pdfCazasola_CZY-SD.pdfapplication/pdf2381076https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/1/Cazasola_CZY-SD.pdfd248d4319e8fa1dc67c328e4f9dd1d50MD51Cazasola_CZY-IT.pdfCazasola_CZY-IT.pdfapplication/pdf7249770https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/2/Cazasola_CZY-IT.pdf53792d749997050f56f3fa27dbcf2024MD52Cazasola_CZY.pdfCazasola_CZY.pdfapplication/pdf2379254https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/3/Cazasola_CZY.pdfb9a000fd67545b91f64882fa314d0626MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54TEXTCazasola_CZY-SD.pdf.txtCazasola_CZY-SD.pdf.txtExtracted texttext/plain94497https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/5/Cazasola_CZY-SD.pdf.txtbf9a122fdd3f033dcb83be330f8036bbMD55Cazasola_CZY-IT.pdf.txtCazasola_CZY-IT.pdf.txtExtracted texttext/plain5627https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/7/Cazasola_CZY-IT.pdf.txtf2b51cd0c0321cafa819db666c1ad05aMD57Cazasola_CZY.pdf.txtCazasola_CZY.pdf.txtExtracted texttext/plain96834https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/9/Cazasola_CZY.pdf.txt428ade94597f894b0371ecd7cde52ea6MD59THUMBNAILCazasola_CZY-SD.pdf.jpgCazasola_CZY-SD.pdf.jpgGenerated Thumbnailimage/jpeg4865https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/6/Cazasola_CZY-SD.pdf.jpg0feb30be31a0a181b60ac9e8834d2c55MD56Cazasola_CZY-IT.pdf.jpgCazasola_CZY-IT.pdf.jpgGenerated Thumbnailimage/jpeg6309https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/8/Cazasola_CZY-IT.pdf.jpg8b1f36ed4dc97639ff1375c48e701d0aMD58Cazasola_CZY.pdf.jpgCazasola_CZY.pdf.jpgGenerated Thumbnailimage/jpeg4865https://repositorio.ucv.edu.pe/bitstream/20.500.12692/145196/10/Cazasola_CZY.pdf.jpg0feb30be31a0a181b60ac9e8834d2c55MD51020.500.12692/145196oai:repositorio.ucv.edu.pe:20.500.12692/1451962024-07-11 22:24:04.54Repositorio de la Universidad César Vallejorepositorio@ucv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.9573765
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).