Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web
Descripción del Articulo
Los ataques Cross-Site Scripting constituyen una de las principales amenazas a la seguridad de las aplicaciones web, al permitir la inyección y ejecución de código malicioso en el navegador de los usuarios. Ante esta problemática, la presente tesis propone un enfoque basado en Machine Learning para...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2026 |
| Institución: | Universidad Señor de Sipan |
| Repositorio: | USS-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uss.edu.pe:20.500.12802/17169 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12802/17169 |
| Nivel de acceso: | acceso abierto |
| Materia: | Cross-Site Scripting (XSS) Machine Learning Seguridad web Detección de intrusiones Clasificación de texto https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
USSS_0780aeeb2d32bbf2005e3ab65995f920 |
|---|---|
| oai_identifier_str |
oai:repositorio.uss.edu.pe:20.500.12802/17169 |
| network_acronym_str |
USSS |
| network_name_str |
USS-Institucional |
| repository_id_str |
4829 |
| dc.title.es_PE.fl_str_mv |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| title |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| spellingShingle |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web Campos Clavo, Bilelmo Cross-Site Scripting (XSS) Machine Learning Seguridad web Detección de intrusiones Clasificación de texto https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| title_full |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| title_fullStr |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| title_full_unstemmed |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| title_sort |
Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads web |
| author |
Campos Clavo, Bilelmo |
| author_facet |
Campos Clavo, Bilelmo |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Minguillo Rubio, Cesar Augusto |
| dc.contributor.author.fl_str_mv |
Campos Clavo, Bilelmo |
| dc.subject.es_PE.fl_str_mv |
Cross-Site Scripting (XSS) Machine Learning Seguridad web Detección de intrusiones Clasificación de texto |
| topic |
Cross-Site Scripting (XSS) Machine Learning Seguridad web Detección de intrusiones Clasificación de texto https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
Los ataques Cross-Site Scripting constituyen una de las principales amenazas a la seguridad de las aplicaciones web, al permitir la inyección y ejecución de código malicioso en el navegador de los usuarios. Ante esta problemática, la presente tesis propone un enfoque basado en Machine Learning para la detección automática de ataques XSS mediante el análisis de payloads textuales. La metodología se basa en el preprocesamiento de un dataset masivo de payloads web etiquetados como benignos y maliciosos, construido a partir de dos datasets públicos y un conjunto de datos sintético generado específicamente para este estudio. Los payloads fueron representados mediante vectorización TF-IDF y utilizados para entrenar modelos tradicionales de Machine Learning, incluyendo Support Vector Machine, Decision Tree, Random Forest, Naive Bayes y XGBoost. El desempeño de los modelos fue evaluado utilizando métricas estandarizadas derivadas de la matriz de confusión, tales como exactitud, precisión, sensibilidad y F1-score. Los resultados experimentales muestran que los modelos Random Forest y XGBoost alcanzaron un desempeño superior, con valores de exactitud superiores al 99.6%, precisión mayor al 99.7% y F1-score cercano a 0.998, evidenciando una alta capacidad para discriminar entre payloads benignos y maliciosos. Asimismo, Naive Bayes destacó por su alta sensibilidad, superando el 99.6%, lo que resulta relevante para minimizar falsos negativos. Finalmente, el modelo seleccionado fue integrado en una aplicación web desarrollada con Flask, permitiendo la detección y localización de ataques XSS en estructuras HTML en tiempo real. |
| publishDate |
2026 |
| dc.date.accessioned.none.fl_str_mv |
2026-02-17T19:44:08Z |
| dc.date.available.none.fl_str_mv |
2026-02-17T19:44:08Z |
| dc.date.issued.fl_str_mv |
2026 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12802/17169 |
| url |
https://hdl.handle.net/20.500.12802/17169 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Señor de Sipán |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional - USS Repositorio Institucional USS |
| dc.source.none.fl_str_mv |
reponame:USS-Institucional instname:Universidad Señor de Sipan instacron:USS |
| instname_str |
Universidad Señor de Sipan |
| instacron_str |
USS |
| institution |
USS |
| reponame_str |
USS-Institucional |
| collection |
USS-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/6/Campos%20Clavo%2c%20Bilelmo.pdf.txt https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/8/Autorizaci%c3%b3n%20del%20autor.pdf.txt https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/10/Informe%20de%20similitud.pdf.txt https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/7/Campos%20Clavo%2c%20Bilelmo.pdf.jpg https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/9/Autorizaci%c3%b3n%20del%20autor.pdf.jpg https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/11/Informe%20de%20similitud.pdf.jpg https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/1/Campos%20Clavo%2c%20Bilelmo.pdf https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/2/Autorizaci%c3%b3n%20del%20autor.pdf https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/3/Informe%20de%20similitud.pdf https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/4/license_rdf https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/5/license.txt |
| bitstream.checksum.fl_str_mv |
b6c3a27009cc800b3ba639a6681c1821 9da3820ab02d7a265b9a8e7594b506dd 25f97a04a800438d59c1914ed3e6cb1f 442888fe83dfbce2f0e1a86a99d0aa00 58378a200569f07367513ed5d92c9871 25ac54b506d1c2fe4faf8cdd391b5d79 92ee67b453158972a46c1bc104ee0f75 c243212d21538047b5aa593d98da257f b47b86c04b2b105bdba1a1600614e37d 3655808e5dd46167956d6870b0f43800 8a4605be74aa9ea9d79846c1fba20a33 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad Señor de Sipán |
| repository.mail.fl_str_mv |
repositorio@uss.edu.pe |
| _version_ |
1858567574851158016 |
| spelling |
Minguillo Rubio, Cesar AugustoCampos Clavo, Bilelmo2026-02-17T19:44:08Z2026-02-17T19:44:08Z2026https://hdl.handle.net/20.500.12802/17169Los ataques Cross-Site Scripting constituyen una de las principales amenazas a la seguridad de las aplicaciones web, al permitir la inyección y ejecución de código malicioso en el navegador de los usuarios. Ante esta problemática, la presente tesis propone un enfoque basado en Machine Learning para la detección automática de ataques XSS mediante el análisis de payloads textuales. La metodología se basa en el preprocesamiento de un dataset masivo de payloads web etiquetados como benignos y maliciosos, construido a partir de dos datasets públicos y un conjunto de datos sintético generado específicamente para este estudio. Los payloads fueron representados mediante vectorización TF-IDF y utilizados para entrenar modelos tradicionales de Machine Learning, incluyendo Support Vector Machine, Decision Tree, Random Forest, Naive Bayes y XGBoost. El desempeño de los modelos fue evaluado utilizando métricas estandarizadas derivadas de la matriz de confusión, tales como exactitud, precisión, sensibilidad y F1-score. Los resultados experimentales muestran que los modelos Random Forest y XGBoost alcanzaron un desempeño superior, con valores de exactitud superiores al 99.6%, precisión mayor al 99.7% y F1-score cercano a 0.998, evidenciando una alta capacidad para discriminar entre payloads benignos y maliciosos. Asimismo, Naive Bayes destacó por su alta sensibilidad, superando el 99.6%, lo que resulta relevante para minimizar falsos negativos. Finalmente, el modelo seleccionado fue integrado en una aplicación web desarrollada con Flask, permitiendo la detección y localización de ataques XSS en estructuras HTML en tiempo real.TesisCiencias de la información como herramientas multidisciplinares y estratégicas en el contexto industrial y de organizacionesInformática y transformación digital en el contexto industrial y organizacional.application/pdfspaUniversidad Señor de SipánPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Repositorio Institucional - USSRepositorio Institucional USSreponame:USS-Institucionalinstname:Universidad Señor de Sipaninstacron:USSCross-Site Scripting (XSS)Machine LearningSeguridad webDetección de intrusionesClasificación de textohttps://purl.org/pe-repo/ocde/ford#2.02.04Detección de ataques Cross-Site Scripting (XSS) mediante técnicas de Machine Learning aplicadas a un dataset masivo de payloads webinfo:eu-repo/semantics/bachelorThesisSUNEDUUniversidad Señor de Sipán. Facultad de Ingeniería, Arquitectura y UrbanismoIngeniero de SistemasIngeniería de Sistemas16787173https://orcid.org/0000-0002-5203-786343254931612076Bances Saavedra, David EnriqueArcila Diaz, Juan CarlosMinguillo Rubio, Cesar Augustohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisTEXTCampos Clavo, Bilelmo.pdf.txtCampos Clavo, Bilelmo.pdf.txtExtracted texttext/plain108786https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/6/Campos%20Clavo%2c%20Bilelmo.pdf.txtb6c3a27009cc800b3ba639a6681c1821MD56Autorización del autor.pdf.txtAutorización del autor.pdf.txtExtracted texttext/plain2159https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/8/Autorizaci%c3%b3n%20del%20autor.pdf.txt9da3820ab02d7a265b9a8e7594b506ddMD58Informe de similitud.pdf.txtInforme de similitud.pdf.txtExtracted texttext/plain97217https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/10/Informe%20de%20similitud.pdf.txt25f97a04a800438d59c1914ed3e6cb1fMD510THUMBNAILCampos Clavo, Bilelmo.pdf.jpgCampos Clavo, Bilelmo.pdf.jpgGenerated Thumbnailimage/jpeg9062https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/7/Campos%20Clavo%2c%20Bilelmo.pdf.jpg442888fe83dfbce2f0e1a86a99d0aa00MD57Autorización del autor.pdf.jpgAutorización del autor.pdf.jpgGenerated Thumbnailimage/jpeg9637https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/9/Autorizaci%c3%b3n%20del%20autor.pdf.jpg58378a200569f07367513ed5d92c9871MD59Informe de similitud.pdf.jpgInforme de similitud.pdf.jpgGenerated Thumbnailimage/jpeg5778https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/11/Informe%20de%20similitud.pdf.jpg25ac54b506d1c2fe4faf8cdd391b5d79MD511ORIGINALCampos Clavo, Bilelmo.pdfCampos Clavo, Bilelmo.pdfapplication/pdf5561481https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/1/Campos%20Clavo%2c%20Bilelmo.pdf92ee67b453158972a46c1bc104ee0f75MD51Autorización del autor.pdfAutorización del autor.pdfapplication/pdf156305https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/2/Autorizaci%c3%b3n%20del%20autor.pdfc243212d21538047b5aa593d98da257fMD52Informe de similitud.pdfInforme de similitud.pdfapplication/pdf2356992https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/3/Informe%20de%20similitud.pdfb47b86c04b2b105bdba1a1600614e37dMD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/4/license_rdf3655808e5dd46167956d6870b0f43800MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.uss.edu.pe/bitstream/20.500.12802/17169/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5520.500.12802/17169oai:repositorio.uss.edu.pe:20.500.12802/171692026-02-18 03:07:43.463Repositorio Institucional de la Universidad Señor de Sipánrepositorio@uss.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.983476 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).