Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias

Descripción del Articulo

Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan...

Descripción completa

Detalles Bibliográficos
Autor: Montalvo Cusi, Marjorie Dayanne
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/21637
Enlace del recurso:https://hdl.handle.net/20.500.12672/21637
Nivel de acceso:acceso abierto
Materia:Python (Lenguaje de programación de computadoras)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
id UNMS_5a39f393fbfa91fbaeeae75962559e7c
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/21637
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.es_PE.fl_str_mv Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
title Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
spellingShingle Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
Montalvo Cusi, Marjorie Dayanne
Python (Lenguaje de programación de computadoras)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
title_short Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
title_full Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
title_fullStr Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
title_full_unstemmed Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
title_sort Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
author Montalvo Cusi, Marjorie Dayanne
author_facet Montalvo Cusi, Marjorie Dayanne
author_role author
dc.contributor.advisor.fl_str_mv Vásquez Serpa, Luis Javier
dc.contributor.author.fl_str_mv Montalvo Cusi, Marjorie Dayanne
dc.subject.es_PE.fl_str_mv Python (Lenguaje de programación de computadoras)
Redes neuronales (Computación)
topic Python (Lenguaje de programación de computadoras)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
https://purl.org/pe-repo/ocde/ford#1.02.02
description Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan tres técnicas de balanceo de datos: Oversampling, Undersampling y SMOTE, en conjunción con el algoritmo de redes neuronales profundas (Deep Neural Network), utilizando datos sintéticos generados por PaySim. Este conjunto de datos simulados emula transacciones bancarias basadas en una muestra de registros financieros existentes extraídos de un mes de operaciones de un servicio de dinero móvil desplegado en un país africano. Todo este análisis y modelado se realizó haciendo uso del lenguaje de programación de Python ejecutado en Colab PRO. Esta elección del entorno Python permitió la implementación y el entrenamiento de modelos de redes neuronales profundas en un entorno flexible y accesible. El enfoque de utilizar datos sintéticos basados en el mundo real y aplicar técnicas avanzadas de aprendizaje automático subraya la relevancia de abordar el desafío de desequilibrio en conjuntos de datos para mejorar la precisión y confiabilidad de los resultados en aplicaciones financieras y más allá.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2024-03-07T14:09:29Z
dc.date.available.none.fl_str_mv 2024-03-07T14:09:29Z
dc.date.issued.fl_str_mv 2023
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.citation.es_PE.fl_str_mv Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/21637
identifier_str_mv Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.
url https://hdl.handle.net/20.500.12672/21637
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional Mayor de San Marcos
Repositorio de Tesis - UNMSM
dc.source.none.fl_str_mv reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/e0cd0802-adf4-46ca-9f12-a913db678d71/download
https://cybertesis.unmsm.edu.pe/bitstreams/29cbdae2-f19c-4043-87dd-18910d8432b1/download
https://cybertesis.unmsm.edu.pe/bitstreams/9e6c4c30-561f-4ef1-82ff-5aca0690c43d/download
https://cybertesis.unmsm.edu.pe/bitstreams/110aab35-ddb6-41b5-ae4e-d1bb8bbdc5f5/download
https://cybertesis.unmsm.edu.pe/bitstreams/261c9295-66b8-450a-8802-f124a307a389/download
https://cybertesis.unmsm.edu.pe/bitstreams/8f3a2a66-ade4-4735-8c06-cd5cfee264e0/download
https://cybertesis.unmsm.edu.pe/bitstreams/fd5f0fa4-8968-4e26-b9d9-49bc51fdcbc3/download
https://cybertesis.unmsm.edu.pe/bitstreams/3fbcaec6-e0d0-41b7-ab0a-79e440afafde/download
https://cybertesis.unmsm.edu.pe/bitstreams/b49dd595-113c-46e1-bf0e-1d05b7190055/download
https://cybertesis.unmsm.edu.pe/bitstreams/849c79d1-e008-4476-bb35-baa6aa6a1df5/download
bitstream.checksum.fl_str_mv ec2e9dad2cee49ad288e8a26b9a7c052
782512d6d2505de415403e9d1327a45e
58d5f3999f6c82cd7c250f14a1aac52e
a06e19b738bffdd5b5bfe7bb9f84a0c4
c6961d39b87cc5724e4177e4e1243043
79df22df3f998db6c9b8e54e94fcb9e8
34b191b6be203b867e745d01017283b9
6aa779d5aea35fa31f2948d604982d4c
04d051a3d33ba7910748cf29cb385e2e
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1846618158279950336
spelling Vásquez Serpa, Luis JavierMontalvo Cusi, Marjorie Dayanne2024-03-07T14:09:29Z2024-03-07T14:09:29Z2023Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/21637Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan tres técnicas de balanceo de datos: Oversampling, Undersampling y SMOTE, en conjunción con el algoritmo de redes neuronales profundas (Deep Neural Network), utilizando datos sintéticos generados por PaySim. Este conjunto de datos simulados emula transacciones bancarias basadas en una muestra de registros financieros existentes extraídos de un mes de operaciones de un servicio de dinero móvil desplegado en un país africano. Todo este análisis y modelado se realizó haciendo uso del lenguaje de programación de Python ejecutado en Colab PRO. Esta elección del entorno Python permitió la implementación y el entrenamiento de modelos de redes neuronales profundas en un entorno flexible y accesible. El enfoque de utilizar datos sintéticos basados en el mundo real y aplicar técnicas avanzadas de aprendizaje automático subraya la relevancia de abordar el desafío de desequilibrio en conjuntos de datos para mejorar la precisión y confiabilidad de los resultados en aplicaciones financieras y más allá.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMPython (Lenguaje de programación de computadoras)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.01https://purl.org/pe-repo/ocde/ford#1.02.02Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancariasinfo:eu-repo/semantics/bachelorThesisSUNEDULicenciada en Computación CientíficaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación CientíficaComputación Científica43389380https://orcid.org/0000-0002-5414-676472398419611026Alvarez Huertas, Frank DuberleeZorrilla Masias, Henryhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis4517355741190698TEXTMontalvo_cm.pdf.txtMontalvo_cm.pdf.txtExtracted texttext/plain79294https://cybertesis.unmsm.edu.pe/bitstreams/e0cd0802-adf4-46ca-9f12-a913db678d71/downloadec2e9dad2cee49ad288e8a26b9a7c052MD57C685_2023_Montalvo_cm_autorizacion.pdf.txtC685_2023_Montalvo_cm_autorizacion.pdf.txtExtracted texttext/plain3798https://cybertesis.unmsm.edu.pe/bitstreams/29cbdae2-f19c-4043-87dd-18910d8432b1/download782512d6d2505de415403e9d1327a45eMD59C685_2023_Montalvo_cm_reporte.pdf.txtC685_2023_Montalvo_cm_reporte.pdf.txtExtracted texttext/plain1539https://cybertesis.unmsm.edu.pe/bitstreams/9e6c4c30-561f-4ef1-82ff-5aca0690c43d/download58d5f3999f6c82cd7c250f14a1aac52eMD511THUMBNAILMontalvo_cm.pdf.jpgMontalvo_cm.pdf.jpgGenerated Thumbnailimage/jpeg14517https://cybertesis.unmsm.edu.pe/bitstreams/110aab35-ddb6-41b5-ae4e-d1bb8bbdc5f5/downloada06e19b738bffdd5b5bfe7bb9f84a0c4MD58C685_2023_Montalvo_cm_autorizacion.pdf.jpgC685_2023_Montalvo_cm_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg20556https://cybertesis.unmsm.edu.pe/bitstreams/261c9295-66b8-450a-8802-f124a307a389/downloadc6961d39b87cc5724e4177e4e1243043MD510C685_2023_Montalvo_cm_reporte.pdf.jpgC685_2023_Montalvo_cm_reporte.pdf.jpgGenerated Thumbnailimage/jpeg16345https://cybertesis.unmsm.edu.pe/bitstreams/8f3a2a66-ade4-4735-8c06-cd5cfee264e0/download79df22df3f998db6c9b8e54e94fcb9e8MD512ORIGINALMontalvo_cm.pdfMontalvo_cm.pdfapplication/pdf3187573https://cybertesis.unmsm.edu.pe/bitstreams/fd5f0fa4-8968-4e26-b9d9-49bc51fdcbc3/download34b191b6be203b867e745d01017283b9MD51C685_2023_Montalvo_cm_autorizacion.pdfapplication/pdf171959https://cybertesis.unmsm.edu.pe/bitstreams/3fbcaec6-e0d0-41b7-ab0a-79e440afafde/download6aa779d5aea35fa31f2948d604982d4cMD55C685_2023_Montalvo_cm_reporte.pdfapplication/pdf7153400https://cybertesis.unmsm.edu.pe/bitstreams/b49dd595-113c-46e1-bf0e-1d05b7190055/download04d051a3d33ba7910748cf29cb385e2eMD56LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/849c79d1-e008-4476-bb35-baa6aa6a1df5/download8a4605be74aa9ea9d79846c1fba20a33MD5220.500.12672/21637oai:cybertesis.unmsm.edu.pe:20.500.12672/216372024-08-16 02:24:31.754https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.0768795
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).