Aplicación RPA para la clasificación de correos electrónicos como phishing y fake news

Descripción del Articulo

Esta investigación se desarrolló con la finalidad de realizar una aplicación de Automatización robótica de procesos para la clasificación de correos electrónicos como phishing y noticias falsas basada en el algoritmo fusionado ELM - K-step CD-K. Se seleccionó investigaciones de diversas revistas y l...

Descripción completa

Detalles Bibliográficos
Autor: Icochea Rivera, George Eduard
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/104470
Enlace del recurso:https://hdl.handle.net/20.500.12692/104470
Nivel de acceso:acceso abierto
Materia:Mensajes por correo electrónico
Noticias falsas
Phishing (Estafas cibernéticas)
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:Esta investigación se desarrolló con la finalidad de realizar una aplicación de Automatización robótica de procesos para la clasificación de correos electrónicos como phishing y noticias falsas basada en el algoritmo fusionado ELM - K-step CD-K. Se seleccionó investigaciones de diversas revistas y libros con una perspectiva de elaboración, técnicas y métodos de clasificación de correos. EL objetivo es que tener los mejores resultados en los indicadores como tiempo de clasificación, eficacia, uso de CPU y de memoria RAM. Se empleó un RPA con cuatro módulos: (a) actualización de la base de datos de URL maliciosos y que contengan noticias falsas, (b) análisis de los correos que contenga una URL y descarta a los otros, (c) validación de los correos que tenga URL no sean maliciosos y (d) traslado de todos los correos con URL maliciosos a una carpeta predefinida. Luego se presentó los resultados de uso del RPA. Posteriormente se presentó una comparación. El RPA con el algoritmo ELM - K-step CD-K obtuvo 0.34 en segundos para el tiempo de clasificación. Del mismo modo, se obtuvo un porcentaje de eficacia de 100%. Asimismo, el porcentaje de uso del CPU fue de 29.57%, mientras que en el modelo de SVM fue de 17.64%. De igual manera, el uso de memoria RAM fue de 286.36 MB, mientras que en el modelo de XGBoost fue de 4.00 MB. Por último, se presentó las recomendaciones para futuras investigaciones como evaluar más indicadores, centrar la investigación en redes sociales, comparar otras herramientas de automatización, tener una implementación web y utilizar otros sistemas de aprendizaje profundo para la mejora en la clasificación.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).