Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web
Descripción del Articulo
Los ataques Cross-Site Scripting constituyen una de las principales amenazas a la seguridad de las aplicaciones web, al permitir la inyección y ejecución de código malicioso en el navegador de los usuarios. Ante esta problemática, la presente tesis propone un enfoque basado en Machine Learning para...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2026 |
| Institución: | Universidad Señor de Sipan |
| Repositorio: | USS-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uss.edu.pe:20.500.12802/17169 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12802/17169 |
| Nivel de acceso: | acceso abierto |
| Materia: | Cross-Site Scripting (XSS) Machine Learning Seguridad web Detección de intrusiones Clasificación de texto https://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | Los ataques Cross-Site Scripting constituyen una de las principales amenazas a la seguridad de las aplicaciones web, al permitir la inyección y ejecución de código malicioso en el navegador de los usuarios. Ante esta problemática, la presente tesis propone un enfoque basado en Machine Learning para la detección automática de ataques XSS mediante el análisis de payloads textuales. La metodología se basa en el preprocesamiento de un dataset masivo de payloads web etiquetados como benignos y maliciosos, construido a partir de dos datasets públicos y un conjunto de datos sintético generado específicamente para este estudio. Los payloads fueron representados mediante vectorización TF-IDF y utilizados para entrenar modelos tradicionales de Machine Learning, incluyendo Support Vector Machine, Decision Tree, Random Forest, Naive Bayes y XGBoost. El desempeño de los modelos fue evaluado utilizando métricas estandarizadas derivadas de la matriz de confusión, tales como exactitud, precisión, sensibilidad y F1-score. Los resultados experimentales muestran que los modelos Random Forest y XGBoost alcanzaron un desempeño superior, con valores de exactitud superiores al 99.6%, precisión mayor al 99.7% y F1-score cercano a 0.998, evidenciando una alta capacidad para discriminar entre payloads benignos y maliciosos. Asimismo, Naive Bayes destacó por su alta sensibilidad, superando el 99.6%, lo que resulta relevante para minimizar falsos negativos. Finalmente, el modelo seleccionado fue integrado en una aplicación web desarrollada con Flask, permitiendo la detección y localización de ataques XSS en estructuras HTML en tiempo real. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).