Detección de parámetros maliciosos en URLs mediante aprendizaje supervisado aplicado en capas intermedias de servicios web

Descripción del Articulo

El crecimiento acelerado de aplicaciones y servicios web ha incrementado la exposición a ciberataques, en particular mediante parámetros maliciosos en URLs. Este trabajo presenta un sistema de detección basado en aprendizaje supervisado, orientado a operar en capas intermedias de servicios web para...

Descripción completa

Detalles Bibliográficos
Autor: Diaz Sanchez, Ricardo Richar
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/16006
Enlace del recurso:https://hdl.handle.net/20.500.12802/16006
Nivel de acceso:acceso abierto
Materia:Aprendizaje supervisado
Detección de intrusiones
Parámetros maliciosos en URLs
Seguridad web
API de clasificación
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El crecimiento acelerado de aplicaciones y servicios web ha incrementado la exposición a ciberataques, en particular mediante parámetros maliciosos en URLs. Este trabajo presenta un sistema de detección basado en aprendizaje supervisado, orientado a operar en capas intermedias de servicios web para mitigar amenazas de inyección y manipulación de solicitudes. Se construyó un dataset balanceado de 20,000 registros (10,000 benignos y 10,000 maliciosos) distribuidos en ocho categorías de ataque, como SQL injection (union, boolean, error-based, time-based, stacked query), NoSQL injection, bypass de autenticación y ataques diferidos. El conjunto se procesó para entrenar y evaluar cinco algoritmos de clasificación: SVM, Decision Tree, Random Forest, Naive Bayes y XGBoost. La evaluación se realizó en términos de eficiencia y desempeño. En eficiencia, Naive Bayes y Decision Tree lograron tiempos de entrenamiento y predicción reducidos, siendo adecuados para detección en tiempo real, mientras que SVM y Random Forest implicaron mayor costo computacional. Respecto al desempeño, medido con precisión, exactitud, recall y F1-score, los algoritmos SVM, Decision Tree, Random Forest y XGBoost alcanzaron un 99% en todas las métricas, mostrando alta capacidad de detección y reducción de falsos positivos. Naive Bayes obtuvo un 97%. Este modelo se integró en una API que actuará como una capa intermedia para detectar parámetros maliciosos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).