Modelo de predicción de deserción de clientes en el sector de aseguradoras peruanas de pólizas vehiculares mediante el uso del algoritmo Random Forest.
Descripción del Articulo
El mercado de seguros en Perú enfrenta desafíos significativos en el sector de seguros vehiculares para personas naturales, donde las aseguradoras han experimentado una caída progresiva en comparación con otros mercados (Asociación Peruana de Empresas de Seguros [APESEG], s.f., Secc. Estadísticas ve...
Autores: | , |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2025 |
Institución: | Universidad Peruana de Ciencias Aplicadas |
Repositorio: | UPC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorioacademico.upc.edu.pe:10757/684271 |
Enlace del recurso: | http://doi.org/10.19083/tesis/684271 http://hdl.handle.net/10757/684271 |
Nivel de acceso: | acceso abierto |
Materia: | Aprendizaje automático Modelo predictivo Seguro vehicular Predicción de clientes Fuga de clientes Machine learning Predictive model Vehicle insurance Churn prediction Customer attrition https://purl.org/pe-repo/ocde/ford#2.02.04 https://purl.org/pe-repo/ocde/ford#2.00.00 |
Sumario: | El mercado de seguros en Perú enfrenta desafíos significativos en el sector de seguros vehiculares para personas naturales, donde las aseguradoras han experimentado una caída progresiva en comparación con otros mercados (Asociación Peruana de Empresas de Seguros [APESEG], s.f., Secc. Estadísticas vehiculares). Este contexto resalta la necesidad de desarrollar un modelo predictivo que identifique clientes potenciales de pérdida, para que las áreas de retención puedan implementar estrategias efectivas y mejorar la rentabilidad y competitividad en el mercado. La presente investigación desarrolla un modelo de predicción de deserción de clientes empleando el algoritmo Random Forest. Se integraron datos internos de Rímac Seguros, complementados con información de RENIEC y SBS, alcanzando un total de 55,000 registros. Tras aplicar técnicas de balanceo (incluyendo SMOTE) e ingeniería de características, el conjunto de datos se dividió en un 70% para entrenamiento y un 30% para validación inicial (Fase 1). Asimismo, se realizó una segunda validación (Fase 2) en un entorno real, utilizando una muestra de 3,327 registros. Para evaluar el desempeño del modelo se emplearon métricas como precisión, recall, F1-score y AUC. Entre los principales obstáculos se hallaron las restricciones de acceso a datos sensibles y los costos derivados del despliegue en la nube. Pese a estas dificultades, el modelo se logró implementar en un entorno cloud, garantizando su escalabilidad y eficacia. En la Fase 1 (validación con datos históricos), el modelo alcanzó una precisión de 88.89%, recall del 94.12%, F1-score de 91.43% y un AUC de 92.71%. En la Fase 2 (validación en entorno real), se observaron mejoras notables, con una exactitud del 97.08%, recall del 97.76% y AUC del 97.34%, lo cual demostró la capacidad del modelo para adaptarse al entorno operativo, reforzando su utilidad para anticipar la deserción de clientes. Se llevó a cabo una validación cualitativa mediante encuestas a 10 expertos en el ámbito tecnológico. Estas evaluaciones consideraron atributos como seguridad, usabilidad, confiabilidad, desempeño y satisfacción del usuario. Los especialistas calificaron de forma positiva el sistema, asignando puntajes que se correspondieron con las categorías "de acuerdo" y "muy de acuerdo". Dichos resultados evidencian no solo la aceptación del modelo desde una perspectiva técnica, sino también la percepción favorable sobre su utilidad, facilidad de uso y confiabilidad. La investigación presenta un modelo predictivo robusto, validado cuantitativa y cualitativa. Sus resultados confirman la viabilidad de la solución para mejorar la retención de clientes en el sector asegurador. Se recomienda explorar otros algoritmos de Machine Learning, profundizar en la interpretabilidad del modelo y automatizar las estrategias de retención sugeridas, optimizando así la toma de decisiones estratégicas y la eficiencia operativa en la industria aseguradora. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).