Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes
Descripción del Articulo
El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetiv...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2024 |
Institución: | Universidad ESAN |
Repositorio: | ESAN-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.esan.edu.pe:20.500.12640/4287 |
Enlace del recurso: | https://hdl.handle.net/20.500.12640/4287 |
Nivel de acceso: | acceso abierto |
Materia: | Seguridad informática Fraude Mensajería electrónica Aprendizaje automático Redes neuronales https://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
ESAN_9176a11110acb7be73d6387da3d4aa91 |
---|---|
oai_identifier_str |
oai:repositorio.esan.edu.pe:20.500.12640/4287 |
network_acronym_str |
ESAN |
network_name_str |
ESAN-Institucional |
repository_id_str |
4835 |
dc.title.none.fl_str_mv |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
title |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
spellingShingle |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes Salinas Bolaños, Yair Andrey Seguridad informática Fraude Mensajería electrónica Aprendizaje automático Redes neuronales https://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
title_full |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
title_fullStr |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
title_full_unstemmed |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
title_sort |
Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentes |
author |
Salinas Bolaños, Yair Andrey |
author_facet |
Salinas Bolaños, Yair Andrey |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Mamani Ticona, Wilfredo |
dc.contributor.author.fl_str_mv |
Salinas Bolaños, Yair Andrey |
dc.subject.none.fl_str_mv |
Seguridad informática Fraude Mensajería electrónica Aprendizaje automático Redes neuronales |
topic |
Seguridad informática Fraude Mensajería electrónica Aprendizaje automático Redes neuronales https://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetivo encontrar el mejor clasificador de fraude en mensajes de texto en el contexto peruano, para lo cual se recolectaron 527 imágenes de las que se obtuvieron 1740 mensajes, etiquetados manualmente como FRAUDE o LEGITIMO, basándose en recomendaciones de entidades públicas/privadas, y validadas por una experta en fraude del rubro de telecomunicaciones; posteriormente, se integraron con bases en otros idiomas, logrando un total de 4475 registros. Los mensajes fueron vectorizados con Word2Vec y FastText. Finalmente, se entrenaron algoritmos de Redes Neuronales Recurrentes (RNN, LSTM, GRU) y combinaciones con CNN para identificar el mejor modelo. Los resultados evaluados con Accuracy, Precision, Recall, F1-score y AUC evidenciaron que el mejor clasificador fue una RNN de 3 capas (200, 160, 1) usando el embedding FastText-NewL de 300 dimensiones, alcanzando 85.62% en Accuracy, 84.49% en Precision, 88.77% en Recall, 86.57% en F1-score y 93.14% en AUC. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-11-26T16:19:28Z |
dc.date.issued.fl_str_mv |
2024 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.other.none.fl_str_mv |
Tesis |
format |
bachelorThesis |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12640/4287 |
url |
https://hdl.handle.net/20.500.12640/4287 |
dc.language.none.fl_str_mv |
Español |
dc.language.iso.none.fl_str_mv |
spa |
language_invalid_str_mv |
Español |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.en.fl_str_mv |
Attribution-ShareAlike 4.0 International |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
Attribution-ShareAlike 4.0 International https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.spatial.none.fl_str_mv |
Perú |
dc.publisher.none.fl_str_mv |
Universidad ESAN |
dc.publisher.country.none.fl_str_mv |
PE |
publisher.none.fl_str_mv |
Universidad ESAN |
dc.source.none.fl_str_mv |
reponame:ESAN-Institucional instname:Universidad ESAN instacron:ESAN |
instname_str |
Universidad ESAN |
instacron_str |
ESAN |
institution |
ESAN |
reponame_str |
ESAN-Institucional |
collection |
ESAN-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.esan.edu.pe/bitstreams/0d0c534f-e869-4b17-8d94-ad95a6f121f5/download https://repositorio.esan.edu.pe/bitstreams/65ef6850-09bd-4761-ac6d-177751b28e84/download https://repositorio.esan.edu.pe/bitstreams/109c0671-6024-4d12-999d-8289b2a4e260/download https://repositorio.esan.edu.pe/bitstreams/1f5894c0-dbbd-43f2-abdd-219711513c07/download https://repositorio.esan.edu.pe/bitstreams/8724ddc9-23c9-4cba-8a77-28c56fb49ce8/download https://repositorio.esan.edu.pe/bitstreams/26075d22-2a1c-46a0-973c-700173faad18/download https://repositorio.esan.edu.pe/bitstreams/e2bf759b-08a9-4af6-85b9-c8582a0408e8/download https://repositorio.esan.edu.pe/bitstreams/7079eb38-d7ed-4f48-b9d7-5cfd4edbc363/download https://repositorio.esan.edu.pe/bitstreams/f0d3586a-2d77-43d0-aea2-8e26f49895df/download https://repositorio.esan.edu.pe/bitstreams/8f2577b5-3f60-475e-ac18-87d4b3395ae9/download https://repositorio.esan.edu.pe/bitstreams/867f54cd-0c86-4411-8144-ef7ea2a86920/download |
bitstream.checksum.fl_str_mv |
a91c5d05d215b26d3ab57e5707d25aec 42915d043ce1d3b0ac1ce660d6378c84 ed033752abc993202ada24a85d372d2d adb7af3ef071a784ffe1b544b9a344ab bb9bdc0b3349e4284e09149f943790b4 7917ceb8b36c286a0a46df417fe813bd 66d79e6d3e6c2551d47822e560ae7fb8 861948250a08d8c6d2e3287535b3036d efd7e8604e9f440edb569cec012d0be0 e4cd4e08b4d5233dcf5c6d490721b58f d2879c52e7d29a78d81e0bcfd3f633d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional ESAN |
repository.mail.fl_str_mv |
repositorio@esan.edu.pe |
_version_ |
1843261917718642688 |
spelling |
Mamani Ticona, WilfredoSalinas Bolaños, Yair AndreyPerú2024-11-26T16:19:28Z2024https://hdl.handle.net/20.500.12640/4287El smishing, o fraude por mensajes de texto, se ha vuelto un problema creciente en el país, debido a la falta de mecanismos adecuados para detectar mensajes fraudulentos, lo que ha generado que muchos ciudadanos sean víctimas de estafa al recibir estos tipos de mensajes. El estudio tuvo como objetivo encontrar el mejor clasificador de fraude en mensajes de texto en el contexto peruano, para lo cual se recolectaron 527 imágenes de las que se obtuvieron 1740 mensajes, etiquetados manualmente como FRAUDE o LEGITIMO, basándose en recomendaciones de entidades públicas/privadas, y validadas por una experta en fraude del rubro de telecomunicaciones; posteriormente, se integraron con bases en otros idiomas, logrando un total de 4475 registros. Los mensajes fueron vectorizados con Word2Vec y FastText. Finalmente, se entrenaron algoritmos de Redes Neuronales Recurrentes (RNN, LSTM, GRU) y combinaciones con CNN para identificar el mejor modelo. Los resultados evaluados con Accuracy, Precision, Recall, F1-score y AUC evidenciaron que el mejor clasificador fue una RNN de 3 capas (200, 160, 1) usando el embedding FastText-NewL de 300 dimensiones, alcanzando 85.62% en Accuracy, 84.49% en Precision, 88.77% en Recall, 86.57% en F1-score y 93.14% en AUC.application/pdfEspañolspaUniversidad ESANPEinfo:eu-repo/semantics/openAccessAttribution-ShareAlike 4.0 Internationalhttps://creativecommons.org/licenses/by-nc-sa/4.0/Seguridad informáticaFraudeMensajería electrónicaAprendizaje automáticoRedes neuronaleshttps://purl.org/pe-repo/ocde/ford#2.02.04Propuesta de modelo predictivo para la detección de fraude en mensajes de texto mediante el uso de Redes Neuronales Recurrentesinfo:eu-repo/semantics/bachelorThesisTesisreponame:ESAN-Institucionalinstname:Universidad ESANinstacron:ESANSUNEDUIngeniero(a) de Tecnologías de Información y SistemasUniversidad ESAN. Facultad de IngenieríaIngeniería de Tecnologías de Información y Sistemas29470979https://orcid.org/0000-0003-1489-905672551707https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional613066Ballón Alvarez, Joseph EberCalderón Niquin, Marks ArturoCamargo Román Mariela IsabelAcceso abiertoORIGINAL2024_ITIS_24-2_01_T.pdfTexto completoapplication/pdf10833696https://repositorio.esan.edu.pe/bitstreams/0d0c534f-e869-4b17-8d94-ad95a6f121f5/downloada91c5d05d215b26d3ab57e5707d25aecMD512trueAnonymousREAD2024_ITIS_24-2_01_F.pdf2024_ITIS_24-2_01_F.pdfAutorización (acceso restringido)application/pdf324482https://repositorio.esan.edu.pe/bitstreams/65ef6850-09bd-4761-ac6d-177751b28e84/download42915d043ce1d3b0ac1ce660d6378c84MD52falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf2024_ITIS_24-2_01_TU.pdfInforme Turnitin (acceso restringido)application/pdf47402542https://repositorio.esan.edu.pe/bitstreams/109c0671-6024-4d12-999d-8289b2a4e260/downloaded033752abc993202ada24a85d372d2dMD53falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81154https://repositorio.esan.edu.pe/bitstreams/1f5894c0-dbbd-43f2-abdd-219711513c07/downloadadb7af3ef071a784ffe1b544b9a344abMD54falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.esan.edu.pe/bitstreams/8724ddc9-23c9-4cba-8a77-28c56fb49ce8/downloadbb9bdc0b3349e4284e09149f943790b4MD55falseAnonymousREADTEXT2024_ITIS_24-2_01_T.pdf.txt2024_ITIS_24-2_01_T.pdf.txtExtracted texttext/plain101110https://repositorio.esan.edu.pe/bitstreams/26075d22-2a1c-46a0-973c-700173faad18/download7917ceb8b36c286a0a46df417fe813bdMD56falseAnonymousREAD2024_ITIS_24-2_01_F.pdf.txt2024_ITIS_24-2_01_F.pdf.txtExtracted texttext/plain6512https://repositorio.esan.edu.pe/bitstreams/e2bf759b-08a9-4af6-85b9-c8582a0408e8/download66d79e6d3e6c2551d47822e560ae7fb8MD58falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf.txt2024_ITIS_24-2_01_TU.pdf.txtExtracted texttext/plain18359https://repositorio.esan.edu.pe/bitstreams/7079eb38-d7ed-4f48-b9d7-5cfd4edbc363/download861948250a08d8c6d2e3287535b3036dMD510falseAdministratorREADTHUMBNAIL2024_ITIS_24-2_01_T.pdf.jpg2024_ITIS_24-2_01_T.pdf.jpgGenerated Thumbnailimage/jpeg3218https://repositorio.esan.edu.pe/bitstreams/f0d3586a-2d77-43d0-aea2-8e26f49895df/downloadefd7e8604e9f440edb569cec012d0be0MD57falseAnonymousREAD2024_ITIS_24-2_01_F.pdf.jpg2024_ITIS_24-2_01_F.pdf.jpgGenerated Thumbnailimage/jpeg4772https://repositorio.esan.edu.pe/bitstreams/8f2577b5-3f60-475e-ac18-87d4b3395ae9/downloade4cd4e08b4d5233dcf5c6d490721b58fMD59falseAdministratorREAD2024_ITIS_24-2_01_TU.pdf.jpg2024_ITIS_24-2_01_TU.pdf.jpgGenerated Thumbnailimage/jpeg4621https://repositorio.esan.edu.pe/bitstreams/867f54cd-0c86-4411-8144-ef7ea2a86920/downloadd2879c52e7d29a78d81e0bcfd3f633d9MD511falseAdministratorREAD20.500.12640/4287oai:repositorio.esan.edu.pe:20.500.12640/42872025-07-17 17:20:21.043https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.esan.edu.peRepositorio Institucional ESANrepositorio@esan.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.871978 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).