Análisis comparativo de técnicas de aprendizaje automático para detectar fraude en tarjetas de crédito

Descripción del Articulo

Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para el aprendizaje supervisado. Este trabajo identifica técnicas como M...

Descripción completa

Detalles Bibliográficos
Autor: Tong Chabes, Luis
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/16166
Enlace del recurso:https://hdl.handle.net/20.500.12590/16166
Nivel de acceso:acceso abierto
Materia:ML Aprendizaje Automático
XgBoost Extreme Gradiente Boost
SVM Máquinas de Vectores de Soporte
BR Regularización Bayesiana
GDA Gradiente de Descenso Adaptativo
NBC Clasificador Bayesiano Ingenuo
KNN K vecinos más cercanos
RF Bosques Aleatorios
ANN Red Neuronal
LR Regresión Logística
TB Impulso del árbol
PCA Análisis de Componentes Principales
TP Verdadero Positivo
TN Verdadero Negativo
FP Falso Positivo
FN Falso Negativo
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para el aprendizaje supervisado. Este trabajo identifica técnicas como Máquinas de Vectores de Soporte, Clasificador Bayesiano Ingenuo, Bosques Aleatorios, Red Neuronal y Extreme Gradiente Boost como las mejores técnicas según los trabajos relacionados. Este trabajo se enfocó en realizar todo el proceso que aborda un proyecto como este, es decir ingeniería de características, preparar los datos, lidiar con el desbalance de datos, entre otros. Se usó como herramienta de evaluación de rendimiento la validación cruzada k-fold para encontrar la mejor parametrización de cada una de estas técnicas, que son evaluadas con métricas de desempeño como exactitud y puntaje f1. Y finalmente hacer una comparación de estos resultados agregando pruebas estadísticas como t de estudiante para obtener la técnica ganadora.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).