Detección de parámetros maliciosos en URLs mediante aprendizaje supervisado aplicado en capas intermedias de servicios web
Descripción del Articulo
El crecimiento acelerado de aplicaciones y servicios web ha incrementado la exposición a ciberataques, en particular mediante parámetros maliciosos en URLs. Este trabajo presenta un sistema de detección basado en aprendizaje supervisado, orientado a operar en capas intermedias de servicios web para...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Señor de Sipan |
| Repositorio: | USS-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uss.edu.pe:20.500.12802/16006 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12802/16006 |
| Nivel de acceso: | acceso abierto |
| Materia: | Aprendizaje supervisado Detección de intrusiones Parámetros maliciosos en URLs Seguridad web API de clasificación https://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | El crecimiento acelerado de aplicaciones y servicios web ha incrementado la exposición a ciberataques, en particular mediante parámetros maliciosos en URLs. Este trabajo presenta un sistema de detección basado en aprendizaje supervisado, orientado a operar en capas intermedias de servicios web para mitigar amenazas de inyección y manipulación de solicitudes. Se construyó un dataset balanceado de 20,000 registros (10,000 benignos y 10,000 maliciosos) distribuidos en ocho categorías de ataque, como SQL injection (union, boolean, error-based, time-based, stacked query), NoSQL injection, bypass de autenticación y ataques diferidos. El conjunto se procesó para entrenar y evaluar cinco algoritmos de clasificación: SVM, Decision Tree, Random Forest, Naive Bayes y XGBoost. La evaluación se realizó en términos de eficiencia y desempeño. En eficiencia, Naive Bayes y Decision Tree lograron tiempos de entrenamiento y predicción reducidos, siendo adecuados para detección en tiempo real, mientras que SVM y Random Forest implicaron mayor costo computacional. Respecto al desempeño, medido con precisión, exactitud, recall y F1-score, los algoritmos SVM, Decision Tree, Random Forest y XGBoost alcanzaron un 99% en todas las métricas, mostrando alta capacidad de detección y reducción de falsos positivos. Naive Bayes obtuvo un 97%. Este modelo se integró en una API que actuará como una capa intermedia para detectar parámetros maliciosos. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).