Análisis comparativo de técnicas de aprendizaje automático para detectar fraude en tarjetas de crédito

Descripción del Articulo

Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para aprendizaje supervisado. Este trabajo identifica técnicas como Máqu...

Descripción completa

Detalles Bibliográficos
Autor: Tong Chabes, Luis
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/17266
Enlace del recurso:https://hdl.handle.net/20.500.12590/17266
Nivel de acceso:acceso abierto
Materia:Detección de Fraude
Aprendizaje Automático
Máquinas de Vectores de Soporte
Clasificador Bayesiano Ingenuo
Bosques Aleatorios
Red Neuronal
Extreme Gradiente Boost
Métricas de Desempeño
Selección de Parámetros
La prueba de McNemar
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para aprendizaje supervisado. Este trabajo identifica técnicas como Máquinas de Vectores de Soporte, Clasificador Bayesiano Ingenuo, Bosques Aleatorios, Red Neuronal y Extreme Gradiente Boost como las mejores técnicas según los trabajos relacionados. Este trabajo se enfocó en realizar todo el proceso que aborda un proyecto como este, es decir ingeniería de características, preparar los datos, lidiar con el desbalance de datos, entre otros. Se usó como herramienta de evaluación de rendimiento la validación cruzada k-fold para encontrar la mejor parametrización de cada una de estas técnicas, que son evaluadas con métricas de desempeño como exactitud y puntaje f1. A continuación se realiza una comparación de estos resultados agregando pruebas estadísticas como t de estudiante para obtener la técnica más adecuada. Finalmente se obtiene la mejor técnica Red Neuronal que por sus resultados es realmente superior a las técnicas restantes.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).