Aplicación RPA para la clasificación de correos electrónicos como phishing y fake news
Descripción del Articulo
Esta investigación se desarrolló con la finalidad de realizar una aplicación de Automatización robótica de procesos para la clasificación de correos electrónicos como phishing y noticias falsas basada en el algoritmo fusionado ELM - K-step CD-K. Se seleccionó investigaciones de diversas revistas y l...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2022 |
Institución: | Universidad Cesar Vallejo |
Repositorio: | UCV-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.ucv.edu.pe:20.500.12692/104470 |
Enlace del recurso: | https://hdl.handle.net/20.500.12692/104470 |
Nivel de acceso: | acceso abierto |
Materia: | Mensajes por correo electrónico Noticias falsas Phishing (Estafas cibernéticas) https://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | Esta investigación se desarrolló con la finalidad de realizar una aplicación de Automatización robótica de procesos para la clasificación de correos electrónicos como phishing y noticias falsas basada en el algoritmo fusionado ELM - K-step CD-K. Se seleccionó investigaciones de diversas revistas y libros con una perspectiva de elaboración, técnicas y métodos de clasificación de correos. EL objetivo es que tener los mejores resultados en los indicadores como tiempo de clasificación, eficacia, uso de CPU y de memoria RAM. Se empleó un RPA con cuatro módulos: (a) actualización de la base de datos de URL maliciosos y que contengan noticias falsas, (b) análisis de los correos que contenga una URL y descarta a los otros, (c) validación de los correos que tenga URL no sean maliciosos y (d) traslado de todos los correos con URL maliciosos a una carpeta predefinida. Luego se presentó los resultados de uso del RPA. Posteriormente se presentó una comparación. El RPA con el algoritmo ELM - K-step CD-K obtuvo 0.34 en segundos para el tiempo de clasificación. Del mismo modo, se obtuvo un porcentaje de eficacia de 100%. Asimismo, el porcentaje de uso del CPU fue de 29.57%, mientras que en el modelo de SVM fue de 17.64%. De igual manera, el uso de memoria RAM fue de 286.36 MB, mientras que en el modelo de XGBoost fue de 4.00 MB. Por último, se presentó las recomendaciones para futuras investigaciones como evaluar más indicadores, centrar la investigación en redes sociales, comparar otras herramientas de automatización, tener una implementación web y utilizar otros sistemas de aprendizaje profundo para la mejora en la clasificación. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).