Implementación de un método de clasificación de minería de datos para detectar páginas web de tipo phishing

Descripción del Articulo

En Latinoamérica, el uso de plataformas virtuales no tenía mayor relevancia que los canales tradicionales. Sin embargo, con la problemática mundial respecto al COVID-19, y el confinamiento, que casi la mayoría de países adoptaron, el canal virtual tuvo un incremento exponencial nunca antes visto, y...

Descripción completa

Detalles Bibliográficos
Autores: Maguiña Maza, Jean Carlos, Soto Calderón, José Luis
Formato: tesis de grado
Fecha de Publicación:2020
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/8895
Enlace del recurso:https://hdl.handle.net/20.500.12802/8895
Nivel de acceso:acceso abierto
Materia:Plataformas virtuales
Ciberdelincuencia
Phishing
Suplantación
Patrones
Atributos
Precisión (en estadística)
Dimensionamiento
Clasificadores
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:En Latinoamérica, el uso de plataformas virtuales no tenía mayor relevancia que los canales tradicionales. Sin embargo, con la problemática mundial respecto al COVID-19, y el confinamiento, que casi la mayoría de países adoptaron, el canal virtual tuvo un incremento exponencial nunca antes visto, y con ello también la ciberdelincuencia. En la actualidad, una de las estafas online más utilizada es el Phishing, páginas idénticas que se construyen para engañar al usuario, y obtener información personal sensible, suplantarlos y robar su dinero o extorsionarlos. Por consiguiente, desde hace un buen tiempo, se vienen desarrollando herramientas para poder combatir el Phishing, mismas que parten por reconocer patrones que logren caracterizar la página web como fraudulenta. Sin embargo, así como evolucionan las técnicas anti-phishing, también evolucionan las técnicas de suplantación. Por lo que los métodos de detección pierden vigencia, y ya no detectan correctamente. Es por ello, que el presente trabajo implementa un método de detección de páginas web utilizando minería de datos, con base en un análisis teórico de la literatura y la selección de los 3 mejores métodos con una excelente precisión. Así como también, la selección de los 32 atributos más utilizados en los 10 mejores métodos de clasificación de páginas web de tipo Phishing. El resultado muestra cifras muy positivas, que además se han puesto a prueba con las 3 mejores técnicas de la actualidad que son AdaBoost, SVM y XGBoost, los mismos que han logrado una precisión de 94%, 95% y 99% respectivamente. Además, el consumo de recursos de los 3 clasificadores mencionados fue en CPU: AdaBoost 43.17%, SVM 15.5% y XGBoost 21.71%. Con respecto a la RAM: AdaBoost consumió 409MB, SVM 17.64MB y XGBoost 4MB. En tal sentido, XGBoost ha tenido un desempeño sobresaliente en su técnica, por formar grupos de datos bien definidos usando técnicas de dimensionamiento y con clasificadores simples, y además con un eficiente uso de recursos computacionales.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).