Modelo de machine learning en la detección de sitios web phishing

Descripción del Articulo

En la actualidad se evidencia el crecimiento de ataques informáticos y de forma específica los ataques phishing, la presente investigación tiene como problema fundamental el rendimiento en la detección de sitios web phishing. Las causas encontradas sugieren profundizar el proceso de la cibersegurida...

Descripción completa

Detalles Bibliográficos
Autor: Villegas Cubas, Juan Elías
Formato: tesis doctoral
Fecha de Publicación:2021
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/8897
Enlace del recurso:https://hdl.handle.net/20.500.12802/8897
Nivel de acceso:acceso abierto
Materia:Inteligencia de amenazas
Aprendizaje automático
Sitios web falsos
Sistema de detección de phishing
Anti-phishing
http://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:En la actualidad se evidencia el crecimiento de ataques informáticos y de forma específica los ataques phishing, la presente investigación tiene como problema fundamental el rendimiento en la detección de sitios web phishing. Las causas encontradas sugieren profundizar el proceso de la ciberseguridad y la detección de phishing, por lo que se plantea como objetivo: Aplicar un sistema de detección de phishing, sustentada en un modelo de machine learning, para el rendimiento en la detección de sitios web falsos. Se propone un modelo de machine learning en la detección de sitios web phishing, construida en seis dimensiones: Sitio web, inteligencia de amenazas, preparación de datos, algoritmos de machine learning, entrenamiento y detección; visto holísticamente que permite la integración de todas las dimensiones; este modelo propuesto se materializa mediante un sistema de detección de phishing que se desarrolla en seis fases: recolección de datos, preparación de datos, selección de algoritmos, entrenamiento del sistema, detección de sitios phishing y evaluación del rendimiento. Finalmente, se implementó el sistema de detección de phishing, utilizando datos de 11055 sitios web que son clasificados como sitios web legítimos y sitios web phishing, de los cuales 2211 sitios web se utilizaron para la evaluación del rendimiento del sistema y se obtiene un accuracy de 97.42% en la detección correcta de forma global de los sitios web, que es mayor en comparación con los resultados de estudios previos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).