Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias
Descripción del Articulo
Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/21637 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/21637 |
| Nivel de acceso: | acceso abierto |
| Materia: | Python (Lenguaje de programación de computadoras) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| id |
UNMS_5a39f393fbfa91fbaeeae75962559e7c |
|---|---|
| oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/21637 |
| network_acronym_str |
UNMS |
| network_name_str |
UNMSM-Tesis |
| repository_id_str |
410 |
| dc.title.es_PE.fl_str_mv |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| title |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| spellingShingle |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias Montalvo Cusi, Marjorie Dayanne Python (Lenguaje de programación de computadoras) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| title_short |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| title_full |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| title_fullStr |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| title_full_unstemmed |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| title_sort |
Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias |
| author |
Montalvo Cusi, Marjorie Dayanne |
| author_facet |
Montalvo Cusi, Marjorie Dayanne |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Vásquez Serpa, Luis Javier |
| dc.contributor.author.fl_str_mv |
Montalvo Cusi, Marjorie Dayanne |
| dc.subject.es_PE.fl_str_mv |
Python (Lenguaje de programación de computadoras) Redes neuronales (Computación) |
| topic |
Python (Lenguaje de programación de computadoras) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| description |
Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan tres técnicas de balanceo de datos: Oversampling, Undersampling y SMOTE, en conjunción con el algoritmo de redes neuronales profundas (Deep Neural Network), utilizando datos sintéticos generados por PaySim. Este conjunto de datos simulados emula transacciones bancarias basadas en una muestra de registros financieros existentes extraídos de un mes de operaciones de un servicio de dinero móvil desplegado en un país africano. Todo este análisis y modelado se realizó haciendo uso del lenguaje de programación de Python ejecutado en Colab PRO. Esta elección del entorno Python permitió la implementación y el entrenamiento de modelos de redes neuronales profundas en un entorno flexible y accesible. El enfoque de utilizar datos sintéticos basados en el mundo real y aplicar técnicas avanzadas de aprendizaje automático subraya la relevancia de abordar el desafío de desequilibrio en conjuntos de datos para mejorar la precisión y confiabilidad de los resultados en aplicaciones financieras y más allá. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2024-03-07T14:09:29Z |
| dc.date.available.none.fl_str_mv |
2024-03-07T14:09:29Z |
| dc.date.issued.fl_str_mv |
2023 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.citation.es_PE.fl_str_mv |
Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/21637 |
| identifier_str_mv |
Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
| url |
https://hdl.handle.net/20.500.12672/21637 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional Mayor de San Marcos Repositorio de Tesis - UNMSM |
| dc.source.none.fl_str_mv |
reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
UNMSM-Tesis |
| collection |
UNMSM-Tesis |
| bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/e0cd0802-adf4-46ca-9f12-a913db678d71/download https://cybertesis.unmsm.edu.pe/bitstreams/29cbdae2-f19c-4043-87dd-18910d8432b1/download https://cybertesis.unmsm.edu.pe/bitstreams/9e6c4c30-561f-4ef1-82ff-5aca0690c43d/download https://cybertesis.unmsm.edu.pe/bitstreams/110aab35-ddb6-41b5-ae4e-d1bb8bbdc5f5/download https://cybertesis.unmsm.edu.pe/bitstreams/261c9295-66b8-450a-8802-f124a307a389/download https://cybertesis.unmsm.edu.pe/bitstreams/8f3a2a66-ade4-4735-8c06-cd5cfee264e0/download https://cybertesis.unmsm.edu.pe/bitstreams/fd5f0fa4-8968-4e26-b9d9-49bc51fdcbc3/download https://cybertesis.unmsm.edu.pe/bitstreams/3fbcaec6-e0d0-41b7-ab0a-79e440afafde/download https://cybertesis.unmsm.edu.pe/bitstreams/b49dd595-113c-46e1-bf0e-1d05b7190055/download https://cybertesis.unmsm.edu.pe/bitstreams/849c79d1-e008-4476-bb35-baa6aa6a1df5/download |
| bitstream.checksum.fl_str_mv |
ec2e9dad2cee49ad288e8a26b9a7c052 782512d6d2505de415403e9d1327a45e 58d5f3999f6c82cd7c250f14a1aac52e a06e19b738bffdd5b5bfe7bb9f84a0c4 c6961d39b87cc5724e4177e4e1243043 79df22df3f998db6c9b8e54e94fcb9e8 34b191b6be203b867e745d01017283b9 6aa779d5aea35fa31f2948d604982d4c 04d051a3d33ba7910748cf29cb385e2e 8a4605be74aa9ea9d79846c1fba20a33 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Cybertesis UNMSM |
| repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
| _version_ |
1846618158279950336 |
| spelling |
Vásquez Serpa, Luis JavierMontalvo Cusi, Marjorie Dayanne2024-03-07T14:09:29Z2024-03-07T14:09:29Z2023Montalvo, M. (2023). Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancarias. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/21637Compara técnicas de balanceo de datos entrenando un algoritmo específico de Machine Learning, a fin de determinar cuál modelo obtiene la mayor puntuación en las métricas de evaluación de modelos de clasificación de fraude en transacciones bancarias Para llevar a cabo esta evaluación, se implementan tres técnicas de balanceo de datos: Oversampling, Undersampling y SMOTE, en conjunción con el algoritmo de redes neuronales profundas (Deep Neural Network), utilizando datos sintéticos generados por PaySim. Este conjunto de datos simulados emula transacciones bancarias basadas en una muestra de registros financieros existentes extraídos de un mes de operaciones de un servicio de dinero móvil desplegado en un país africano. Todo este análisis y modelado se realizó haciendo uso del lenguaje de programación de Python ejecutado en Colab PRO. Esta elección del entorno Python permitió la implementación y el entrenamiento de modelos de redes neuronales profundas en un entorno flexible y accesible. El enfoque de utilizar datos sintéticos basados en el mundo real y aplicar técnicas avanzadas de aprendizaje automático subraya la relevancia de abordar el desafío de desequilibrio en conjuntos de datos para mejorar la precisión y confiabilidad de los resultados en aplicaciones financieras y más allá.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMPython (Lenguaje de programación de computadoras)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.01https://purl.org/pe-repo/ocde/ford#1.02.02Comparación de técnicas de balanceo de datos para la clasificación de fraude en transacciones bancariasinfo:eu-repo/semantics/bachelorThesisSUNEDULicenciada en Computación CientíficaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación CientíficaComputación Científica43389380https://orcid.org/0000-0002-5414-676472398419611026Alvarez Huertas, Frank DuberleeZorrilla Masias, Henryhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis4517355741190698TEXTMontalvo_cm.pdf.txtMontalvo_cm.pdf.txtExtracted texttext/plain79294https://cybertesis.unmsm.edu.pe/bitstreams/e0cd0802-adf4-46ca-9f12-a913db678d71/downloadec2e9dad2cee49ad288e8a26b9a7c052MD57C685_2023_Montalvo_cm_autorizacion.pdf.txtC685_2023_Montalvo_cm_autorizacion.pdf.txtExtracted texttext/plain3798https://cybertesis.unmsm.edu.pe/bitstreams/29cbdae2-f19c-4043-87dd-18910d8432b1/download782512d6d2505de415403e9d1327a45eMD59C685_2023_Montalvo_cm_reporte.pdf.txtC685_2023_Montalvo_cm_reporte.pdf.txtExtracted texttext/plain1539https://cybertesis.unmsm.edu.pe/bitstreams/9e6c4c30-561f-4ef1-82ff-5aca0690c43d/download58d5f3999f6c82cd7c250f14a1aac52eMD511THUMBNAILMontalvo_cm.pdf.jpgMontalvo_cm.pdf.jpgGenerated Thumbnailimage/jpeg14517https://cybertesis.unmsm.edu.pe/bitstreams/110aab35-ddb6-41b5-ae4e-d1bb8bbdc5f5/downloada06e19b738bffdd5b5bfe7bb9f84a0c4MD58C685_2023_Montalvo_cm_autorizacion.pdf.jpgC685_2023_Montalvo_cm_autorizacion.pdf.jpgGenerated Thumbnailimage/jpeg20556https://cybertesis.unmsm.edu.pe/bitstreams/261c9295-66b8-450a-8802-f124a307a389/downloadc6961d39b87cc5724e4177e4e1243043MD510C685_2023_Montalvo_cm_reporte.pdf.jpgC685_2023_Montalvo_cm_reporte.pdf.jpgGenerated Thumbnailimage/jpeg16345https://cybertesis.unmsm.edu.pe/bitstreams/8f3a2a66-ade4-4735-8c06-cd5cfee264e0/download79df22df3f998db6c9b8e54e94fcb9e8MD512ORIGINALMontalvo_cm.pdfMontalvo_cm.pdfapplication/pdf3187573https://cybertesis.unmsm.edu.pe/bitstreams/fd5f0fa4-8968-4e26-b9d9-49bc51fdcbc3/download34b191b6be203b867e745d01017283b9MD51C685_2023_Montalvo_cm_autorizacion.pdfapplication/pdf171959https://cybertesis.unmsm.edu.pe/bitstreams/3fbcaec6-e0d0-41b7-ab0a-79e440afafde/download6aa779d5aea35fa31f2948d604982d4cMD55C685_2023_Montalvo_cm_reporte.pdfapplication/pdf7153400https://cybertesis.unmsm.edu.pe/bitstreams/b49dd595-113c-46e1-bf0e-1d05b7190055/download04d051a3d33ba7910748cf29cb385e2eMD56LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/849c79d1-e008-4476-bb35-baa6aa6a1df5/download8a4605be74aa9ea9d79846c1fba20a33MD5220.500.12672/21637oai:cybertesis.unmsm.edu.pe:20.500.12672/216372024-08-16 02:24:31.754https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.0768795 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).