XGBoost Aplicado a la Predicción de Ventas, Deserción y Pagos en Seguros de Salud: Un Estudio en Perú

Descripción del Articulo

El sector de seguros médicos demanda herramientas predictivas sofisticadas para optimizar la gestión integral de ventas, deserción de clientes y comportamiento de pago. Este estudio evaluó la efectividad del algoritmo de machine learning XGBoost para la predicción simultánea de estas variables críti...

Descripción completa

Detalles Bibliográficos
Autor: Cárdenas Goyena, Rosario Milagros
Formato: artículo
Fecha de Publicación:2025
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:Revistas - Universidad Nacional Mayor de San Marcos
Lenguaje:español
OAI Identifier:oai:revistasinvestigacion.unmsm.edu.pe:article/32348
Enlace del recurso:https://revistasinvestigacion.unmsm.edu.pe/index.php/rpcsis/article/view/32348
Nivel de acceso:acceso abierto
Materia:XGBoost
seguros médicos
deserción de clientes
series temporales
factores macroeconómicos
health insurance
customer churn
time series forecasting
macroeconomic variables
Descripción
Sumario:El sector de seguros médicos demanda herramientas predictivas sofisticadas para optimizar la gestión integral de ventas, deserción de clientes y comportamiento de pago. Este estudio evaluó la efectividad del algoritmo de machine learning XGBoost para la predicción simultánea de estas variables críticas en el contexto peruano, incorporando sistemáticamente variables macroeconómicas y patrones estacionales dentro de un marco metodológico unificado—aspecto escasamente explorado en la literatura especializada del sector asegurador. Se utilizaron 86 millones de registros (2005-2023) de registros históricos de una compañía aseguradora de salud del mercado peruano, implementando un esquema predictivo basado en ventanas deslizantes temporales (12-24 lags) y validación cruzada específicamente diseñada para series temporales con cuatro iteraciones independientes. Los resultados empíricos demostraron que XGBoost superó consistentemente a cuatro métodos de pronóstico tradicionales (promedio total, promedio último año, último valor y tendencia año anterior) en todos los escenarios analizados, alcanzando errores MAPE promedio de 7.08% para ventas (reducción del 46% respecto al mejor método simple con 13.11%), 7.72% para deserción de clientes (reducción del 47% frente a 13.75%) y 3.32% para comportamiento de pago (reducción del 67% comparado con 4.85%). El análisis de importancia de variables identificó que el índice de desempleo urbano (correlación -0.61 con ventas) y los rezagos temporales de 1-2 períodos previos constituyeron factores determinantes en la capacidad predictiva del modelo. Se concluye que la implementación de XGBoost con integración sistemática de variables macroeconómicas mejora significativamente la precisión predictiva en la gestión financiera del sector asegurador peruano, facilitando una toma de decisiones estratégicas más robusta e informada para la optimización operacional y financiera, con potencial aplicabilidad en mercados emergentes similares.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).