Análisis comparativo de algoritmos de machine learning para predecir morosidad en clientes afiliados a la entidad financiera San Francisco de Mocupe

Descripción del Articulo

El riesgo crediticio es un desafío clave en el sector financiero, especialmente en entidades como cooperativas y microfinancieras, donde la falta de información precisa dificulta la toma de decisiones y afecta la estabilidad económica. A corto plazo, la morosidad genera problemas de liquidez y, a la...

Descripción completa

Detalles Bibliográficos
Autor: Vasquez Cercado, Darwin Alain
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/14483
Enlace del recurso:https://hdl.handle.net/20.500.12802/14483
Nivel de acceso:acceso abierto
Materia:Machine learning
Morosidad
Gestión de riesgos
LightGBM
XGBoost
Random Forest
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El riesgo crediticio es un desafío clave en el sector financiero, especialmente en entidades como cooperativas y microfinancieras, donde la falta de información precisa dificulta la toma de decisiones y afecta la estabilidad económica. A corto plazo, la morosidad genera problemas de liquidez y, a largo plazo, puede comprometer la solvencia institucional. En este contexto, la predicción efectiva de la morosidad es fundamental para mitigar pérdidas y optimizar la gestión del crédito. Este estudio aborda el problema de la predicción de morosidad en clientes de la entidad financiera San Francisco de Mocupe mediante un análisis comparativo de los algoritmos de machine learning XGBoost, LightGBM y Random Forest. Se utilizó un enfoque cuantitativo con datos históricos que incluyeron variables sociodemográficas, crediticias y de comportamiento de pago. Se aplicaron técnicas de depuración como el rango intercuartil (IQR) para tratar valores atípicos y estrategias de imputación para datos faltantes. Además, se implementó la codificación de etiquetas para variables categóricas y se generaron nuevas variables para mejorar la capacidad predictiva. Los modelos fueron desarrollados en Python y optimizados con ajuste de hiperparámetros. La evaluación de desempeño mostró que LightGBM obtuvo la mayor precisión (95%), seguido de XGBoost (94%) y Random Forest (93%). Además, los modelos lograron un buen equilibrio entre precisión, recall y F1-score, evidenciando su capacidad para identificar clientes morosos y no morosos de manera efectiva. En conclusión, LightGBM se posiciona como la mejor alternativa para la predicción de morosidad en la entidad analizada. Estos hallazgos refuerzan el valor de la inteligencia artificial en la gestión financiera moderna.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).