Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes

Descripción del Articulo

El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetiv...

Descripción completa

Detalles Bibliográficos
Autor: Salinas Bolaños, Yair Andrey
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad ESAN
Repositorio:ESAN-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.esan.edu.pe:20.500.12640/4287
Enlace del recurso:https://hdl.handle.net/20.500.12640/4287
Nivel de acceso:acceso abierto
Materia:Seguridad informática
Fraude
Mensajería electrónica
Aprendizaje automático
Redes neuronales
https://purl.org/pe-repo/ocde/ford#2.02.04
id ESAN_9176a11110acb7be73d6387da3d4aa91
oai_identifier_str oai:repositorio.esan.edu.pe:20.500.12640/4287
network_acronym_str ESAN
network_name_str ESAN-Institucional
repository_id_str 4835
dc.title.none.fl_str_mv Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
title Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
spellingShingle Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
Salinas Bolaños, Yair Andrey
Seguridad informática
Fraude
Mensajería electrónica
Aprendizaje automático
Redes neuronales
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
title_full Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
title_fullStr Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
title_full_unstemmed Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
title_sort Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
author Salinas Bolaños, Yair Andrey
author_facet Salinas Bolaños, Yair Andrey
author_role author
dc.contributor.advisor.fl_str_mv Mamani Ticona, Wilfredo
dc.contributor.author.fl_str_mv Salinas Bolaños, Yair Andrey
dc.subject.none.fl_str_mv Seguridad informática
Fraude
Mensajería electrónica
Aprendizaje automático
Redes neuronales
topic Seguridad informática
Fraude
Mensajería electrónica
Aprendizaje automático
Redes neuronales
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetivo encontrar el mejor clasificador de fraude en mensajes de texto en el contexto peruano, para lo cual se recolectaron 527 imágenes de las que se obtuvieron 1740 mensajes, etiquetados manualmente como FRAUDE o LEGITIMO, basándose en recomendaciones de entidades públicas/privadas, y validadas por una experta en fraude del rubro de telecomunicaciones; posteriormente, se integraron con bases en otros idiomas, logrando un total de 4475 registros. Los mensajes fueron vectorizados con Word2Vec y FastText. Finalmente, se entrenaron algoritmos de Redes Neuronales Recurrentes (RNN, LSTM, GRU) y combinaciones con CNN para identificar el mejor modelo. Los resultados evaluados con Accuracy, Precision, Recall, F1-score y AUC evidenciaron que el mejor clasificador fue una RNN de 3 capas (200, 160, 1) usando el embedding FastText-NewL de 300 dimensiones, alcanzando 85.62% en Accuracy, 84.49% en Precision, 88.77% en Recall, 86.57% en F1-score y 93.14% en AUC.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-11-26T16:19:28Z
dc.date.issued.fl_str_mv 2024
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.none.fl_str_mv Tesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12640/4287
url https://hdl.handle.net/20.500.12640/4287
dc.language.none.fl_str_mv Español
dc.language.iso.none.fl_str_mv spa
language_invalid_str_mv Español
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.en.fl_str_mv Attribution-ShareAlike 4.0 International
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv Attribution-ShareAlike 4.0 International
https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.coverage.spatial.none.fl_str_mv Perú
dc.publisher.none.fl_str_mv Universidad ESAN
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad ESAN
dc.source.none.fl_str_mv reponame:ESAN-Institucional
instname:Universidad ESAN
instacron:ESAN
instname_str Universidad ESAN
instacron_str ESAN
institution ESAN
reponame_str ESAN-Institucional
collection ESAN-Institucional
bitstream.url.fl_str_mv https://repositorio.esan.edu.pe/bitstreams/0d0c534f-e869-4b17-8d94-ad95a6f121f5/download
https://repositorio.esan.edu.pe/bitstreams/65ef6850-09bd-4761-ac6d-177751b28e84/download
https://repositorio.esan.edu.pe/bitstreams/109c0671-6024-4d12-999d-8289b2a4e260/download
https://repositorio.esan.edu.pe/bitstreams/1f5894c0-dbbd-43f2-abdd-219711513c07/download
https://repositorio.esan.edu.pe/bitstreams/8724ddc9-23c9-4cba-8a77-28c56fb49ce8/download
https://repositorio.esan.edu.pe/bitstreams/26075d22-2a1c-46a0-973c-700173faad18/download
https://repositorio.esan.edu.pe/bitstreams/e2bf759b-08a9-4af6-85b9-c8582a0408e8/download
https://repositorio.esan.edu.pe/bitstreams/7079eb38-d7ed-4f48-b9d7-5cfd4edbc363/download
https://repositorio.esan.edu.pe/bitstreams/f0d3586a-2d77-43d0-aea2-8e26f49895df/download
https://repositorio.esan.edu.pe/bitstreams/8f2577b5-3f60-475e-ac18-87d4b3395ae9/download
https://repositorio.esan.edu.pe/bitstreams/867f54cd-0c86-4411-8144-ef7ea2a86920/download
bitstream.checksum.fl_str_mv a91c5d05d215b26d3ab57e5707d25aec
42915d043ce1d3b0ac1ce660d6378c84
ed033752abc993202ada24a85d372d2d
adb7af3ef071a784ffe1b544b9a344ab
bb9bdc0b3349e4284e09149f943790b4
7917ceb8b36c286a0a46df417fe813bd
66d79e6d3e6c2551d47822e560ae7fb8
861948250a08d8c6d2e3287535b3036d
efd7e8604e9f440edb569cec012d0be0
e4cd4e08b4d5233dcf5c6d490721b58f
d2879c52e7d29a78d81e0bcfd3f633d9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional ESAN
repository.mail.fl_str_mv repositorio@esan.edu.pe
_version_ 1843261917718642688
spelling Mamani Ticona, WilfredoSalinas Bolaños, Yair AndreyPerú2024-11-26T16:19:28Z2024https://hdl.handle.net/20.500.12640/4287El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetivo encontrar el mejor clasificador de fraude en mensajes de texto en el contexto peruano, para lo cual se recolectaron 527 imágenes de las que se obtuvieron 1740 mensajes, etiquetados manualmente como FRAUDE o LEGITIMO, basándose en recomendaciones de entidades públicas/privadas, y validadas por una experta en fraude del rubro de telecomunicaciones; posteriormente, se integraron con bases en otros idiomas, logrando un total de 4475 registros. Los mensajes fueron vectorizados con Word2Vec y FastText. Finalmente, se entrenaron algoritmos de Redes Neuronales Recurrentes (RNN, LSTM, GRU) y combinaciones con CNN para identificar el mejor modelo. Los resultados evaluados con Accuracy, Precision, Recall, F1-score y AUC evidenciaron que el mejor clasificador fue una RNN de 3 capas (200, 160, 1) usando el embedding FastText-NewL de 300 dimensiones, alcanzando 85.62% en Accuracy, 84.49% en Precision, 88.77% en Recall, 86.57% en F1-score y 93.14% en AUC.application/pdfEspañolspaUniversidad ESANPEinfo:eu-repo/semantics/openAccessAttribution-ShareAlike 4.0 Internationalhttps://creativecommons.org/licenses/by-nc-sa/4.0/Seguridad informáticaFraudeMensajería electrónicaAprendizaje automáticoRedes neuronaleshttps://purl.org/pe-repo/ocde/ford#2.02.04Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentesinfo:eu-repo/semantics/bachelorThesisTesisreponame:ESAN-Institucionalinstname:Universidad ESANinstacron:ESANSUNEDUIngeniero(a) de Tecnologías de Información y SistemasUniversidad ESAN. Facultad de IngenieríaIngeniería de Tecnologías de Información y Sistemas29470979https://orcid.org/0000-0003-1489-905672551707https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional613066Ballón Alvarez, Joseph EberCalderón Niquin, Marks ArturoCamargo Román Mariela IsabelAcceso abiertoORIGINAL2024_ITIS_24-2_01_T.pdfTexto completoapplication/pdf10833696https://repositorio.esan.edu.pe/bitstreams/0d0c534f-e869-4b17-8d94-ad95a6f121f5/downloada91c5d05d215b26d3ab57e5707d25aecMD512trueAnonymousREAD2024_ITIS_24-2_01_F.pdf2024_ITIS_24-2_01_F.pdfAutorización (acceso restringido)application/pdf324482https://repositorio.esan.edu.pe/bitstreams/65ef6850-09bd-4761-ac6d-177751b28e84/download42915d043ce1d3b0ac1ce660d6378c84MD52falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf2024_ITIS_24-2_01_TU.pdfInforme Turnitin (acceso restringido)application/pdf47402542https://repositorio.esan.edu.pe/bitstreams/109c0671-6024-4d12-999d-8289b2a4e260/downloaded033752abc993202ada24a85d372d2dMD53falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81154https://repositorio.esan.edu.pe/bitstreams/1f5894c0-dbbd-43f2-abdd-219711513c07/downloadadb7af3ef071a784ffe1b544b9a344abMD54falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.esan.edu.pe/bitstreams/8724ddc9-23c9-4cba-8a77-28c56fb49ce8/downloadbb9bdc0b3349e4284e09149f943790b4MD55falseAnonymousREADTEXT2024_ITIS_24-2_01_T.pdf.txt2024_ITIS_24-2_01_T.pdf.txtExtracted texttext/plain101110https://repositorio.esan.edu.pe/bitstreams/26075d22-2a1c-46a0-973c-700173faad18/download7917ceb8b36c286a0a46df417fe813bdMD56falseAnonymousREAD2024_ITIS_24-2_01_F.pdf.txt2024_ITIS_24-2_01_F.pdf.txtExtracted texttext/plain6512https://repositorio.esan.edu.pe/bitstreams/e2bf759b-08a9-4af6-85b9-c8582a0408e8/download66d79e6d3e6c2551d47822e560ae7fb8MD58falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf.txt2024_ITIS_24-2_01_TU.pdf.txtExtracted texttext/plain18359https://repositorio.esan.edu.pe/bitstreams/7079eb38-d7ed-4f48-b9d7-5cfd4edbc363/download861948250a08d8c6d2e3287535b3036dMD510falseAdministratorREADTHUMBNAIL2024_ITIS_24-2_01_T.pdf.jpg2024_ITIS_24-2_01_T.pdf.jpgGenerated Thumbnailimage/jpeg3218https://repositorio.esan.edu.pe/bitstreams/f0d3586a-2d77-43d0-aea2-8e26f49895df/downloadefd7e8604e9f440edb569cec012d0be0MD57falseAnonymousREAD2024_ITIS_24-2_01_F.pdf.jpg2024_ITIS_24-2_01_F.pdf.jpgGenerated Thumbnailimage/jpeg4772https://repositorio.esan.edu.pe/bitstreams/8f2577b5-3f60-475e-ac18-87d4b3395ae9/downloade4cd4e08b4d5233dcf5c6d490721b58fMD59falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf.jpg2024_ITIS_24-2_01_TU.pdf.jpgGenerated Thumbnailimage/jpeg4621https://repositorio.esan.edu.pe/bitstreams/867f54cd-0c86-4411-8144-ef7ea2a86920/downloadd2879c52e7d29a78d81e0bcfd3f633d9MD511falseAdministratorREAD20.500.12640/4287oai:repositorio.esan.edu.pe:20.500.12640/42872025-07-17 17:20:21.043https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.esan.edu.peRepositorio Institucional ESANrepositorio@esan.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.871978
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).