Comparación de los modelos bosque aleatorio y regresión logística para la predicción de reincidencia en infractores de tránsito, Arequipa 2025

Descripción del Articulo

La investigación evaluó y comparó el desempeño de los modelos de aprendizaje automático Bosque Aleatorio y Regresión Logística en la predicción de la reincidencia en infracciones de tránsito, empleando 49,811 registros administrativos anonimizados del año 2024, obtenidos de la Plataforma Nacional de...

Descripción completa

Detalles Bibliográficos
Autor: Fernandez Meza, Leger Hardy
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/174313
Enlace del recurso:https://hdl.handle.net/20.500.12692/174313
Nivel de acceso:acceso abierto
Materia:Confidencialidad
Gestión
Institución
https://purl.org/pe-repo/ocde/ford#5.06.02
Descripción
Sumario:La investigación evaluó y comparó el desempeño de los modelos de aprendizaje automático Bosque Aleatorio y Regresión Logística en la predicción de la reincidencia en infracciones de tránsito, empleando 49,811 registros administrativos anonimizados del año 2024, obtenidos de la Plataforma Nacional de Datos Abiertos (PNDA) de una entidad pública local del sur del Perú. Fue un estudio de tipo básico, enfoque cuantitativo, diseño no experimental y método comparativo, implementado mediante programación en Python bajo criterios de completitud, trazabilidad y confidencialidad. Los modelos fueron evaluados con métricas replicables como exactitud (Accuracy), puntaje F1 (F1-score), precisión (Precision), sensibilidad (Recall) y área bajo la curva ROC (AUC–ROC), alcanzando una precisión superior al 85 % y un AUC–ROC de 0.89. El Bosque Aleatorio mostró un mejor desempeño global, mientras que la Regresión Logística destacó por su menor tasa de errores tipo I, siendo más confiable para evitar falsos positivos. Se identificaron como variables influyentes el intervalo entre papeletas, el estado de la papeleta y ciertos códigos de infracción. Los hallazgos evidencian que es factible aplicar datos abiertos y herramientas libres en la gestión pública local, contribuyendo al ODS 16.6, orientado a fortalecer instituciones eficaces y transparentes.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).