Modelos de machine learning para el análisis de calidad del agua y su contribución para la agricultura

Descripción del Articulo

El presente trabajo aplica modelos de machine learning para analizar los parámetros que influyen en la calidad del agua en la cuenca del río Chancay - Lambayeque, con especial énfasis en su impacto sobre la agricultura. Se utilizó la metodología CRISP-DM, empleando la plataforma Orange para el model...

Descripción completa

Detalles Bibliográficos
Autores: Delgado Pinedo, Daniel Francisco, Trujillo Vasquez, Sergio Alejandro
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad de Lima
Repositorio:ULIMA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ulima.edu.pe:20.500.12724/23146
Enlace del recurso:https://hdl.handle.net/20.500.12724/23146
Nivel de acceso:acceso abierto
Materia:Pendiente
https://purl.org/pe-repo/ocde/ford#2.11.04
Descripción
Sumario:El presente trabajo aplica modelos de machine learning para analizar los parámetros que influyen en la calidad del agua en la cuenca del río Chancay - Lambayeque, con especial énfasis en su impacto sobre la agricultura. Se utilizó la metodología CRISP-DM, empleando la plataforma Orange para el modelado y evaluación de distintos modelos de machine learning (multiple linear regression (MLR), support vector machine (SVM), decision tree (DT), random forest (RF), artificial neural network (ANN) y xgboost (extreme gradient boosting)). Los modelos fueron evaluados mediante R2, MAE, MSE y RMSE, destacando el buen desempeño del Random Forest, Decision Tree, ANN para el análisis del OD con un R2 de 0,741, 0714 y 0,785 respectivamente; para el análisis de la DBO los resultados del R2 fueron 0,856, 0,901 y 0,871. Por otro lado, el modelo de XGBoost sólo presentó buenos resultados con la DBO, siendo un R2 de 0,815. Los parámetros con mayor relevancia para las variables Oxígeno Disuelto (OD) y Demanda Bioquímica de Oxígeno (DBO) fueron el Cadmio y Fósforo Total, presentando un score máximo de 0,684 y 0,287 respectivamente. Asimismo, los parámetros que también presentaron un buen score fueron Boro y Litio (para OD) y Nitrógeno Total y Cromo Total (para DBO), según análisis de importancia de atributos (RReliefF y Score obtenido). Se recomienda priorizar el monitoreo de estos elementos y revisar su inclusión en los Estándares de Calidad Ambiental para el Agua (ECA) para categoría 3 (riego y bebida de animales). Los resultados evidencian el potencial del machine learning como herramienta para mejorar la gestión hídrica en contextos agrícolas.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).