1
tesis de grado
Publicado 2025
Enlace

El presente trabajo aplica modelos de machine learning para analizar los parámetros que influyen en la calidad del agua en la cuenca del río Chancay - Lambayeque, con especial énfasis en su impacto sobre la agricultura. Se utilizó la metodología CRISP-DM, empleando la plataforma Orange para el modelado y evaluación de distintos modelos de machine learning (multiple linear regression (MLR), support vector machine (SVM), decision tree (DT), random forest (RF), artificial neural network (ANN) y xgboost (extreme gradient boosting)). Los modelos fueron evaluados mediante R2, MAE, MSE y RMSE, destacando el buen desempeño del Random Forest, Decision Tree, ANN para el análisis del OD con un R2 de 0,741, 0714 y 0,785 respectivamente; para el análisis de la DBO los resultados del R2 fueron 0,856, 0,901 y 0,871. Por otro lado, el modelo de XGBoost sólo presentó buenos resultados con la D...