Modelo de Scoring para la segmentación de clientes morosos usando minería de datos en una empresa de cobranzas del Perú

Descripción del Articulo

El objetivo de esta investigación fue desarrollar un Modelo de Scoring para segmentación de clientes morosos con más de 180 días mora, y con mayor probabilidad de pago, usando técnicas de minería de datos y análisis predictivo para reducir costos mediante la reasignación de carteras de cobranza en u...

Descripción completa

Detalles Bibliográficos
Autor: Pérez Ramón, Robert Mesías
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/16845
Enlace del recurso:https://hdl.handle.net/20.500.12672/16845
Nivel de acceso:acceso abierto
Materia:Moratoria
Segmentación del mercado
Arboles de decisión
Minería de datos
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El objetivo de esta investigación fue desarrollar un Modelo de Scoring para segmentación de clientes morosos con más de 180 días mora, y con mayor probabilidad de pago, usando técnicas de minería de datos y análisis predictivo para reducir costos mediante la reasignación de carteras de cobranza en una empresa de cobranzas del Perú. Para el desarrollo del modelo se utilizó data histórica del período de junio a setiembre 2020. Se consideró a los clientes morosos agrupados en tramos de morosidad. Cada tramo está definido según el número de días acumulado de morosidad. De estos tramos, se escogió el de “más de 180 días de mora” debido a que en este grupo se encuentran la mayor cantidad de clientes con el más bajo nivel de efectividad de recupero. Se utilizó la metodología CRISP-DM para implementar la solución. Durante la fase de modelado se definió, entre otras, la variable dummy “Flag_Pago_Cliente” para clasificar a los clientes como Bueno o Mal pagador. Para la construcción del modelo y las pruebas se utilizó la herramienta Rapidminer. En base a las técnicas de análisis predictivo se desarrollaron 4 modelos: K-Nearest Neighbors, Árbol de Decisión, SVM y Regresión Logística. Se seleccionó el Modelo de Regresión Logística porque durante los 4 meses de análisis de estudio tuvo mayor nivel de exactitud con un promedio de 98.4% y un AUC de 81.51%. Finalmente, se planteó la propuesta de implementación con una nueva distribución en la asignación de la cartera, considerando la gestión del 20% a través del Call Interno y el 80% en Call Externo. Los clientes con mejores probabilidades de pago fueron asignados al Call Interno. Mediante una simulación del despliegue de la solución se obtuvo que la efectividad de pago del Call Interno, en promedio mensual en los 4 meses, fue de 6.46% versus el 0.84% del Call Externo. Mientras que a nivel de Volumen de Clientes que pagan, en promedio mensual, fueron 192 clientes más en el Call Interno respecto al Call Externo, con lo que quedó validado y justificado la importancia del modelo en la reasignación de carteras con más de 180 días mora.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).