Aplicación de técnicas de Big Data e inteligencia artificial para mejorar la capacidad analítica de EGEMSA

Descripción del Articulo

En el presente trabajo de investigación se aplica un conjunto de técnicas de Big Data: Data Lake, Web Scraping, ETL (Extracción, Transformación y Carga de datos) y de Inteligencia Artificial (particularmente Machine Learning) con el propósito de mejorar la capacidad analítica de la Gerencia Comercia...

Descripción completa

Detalles Bibliográficos
Autores: Moreano Briceño, Grover, Ticona Bejar, Saul Waldemar
Formato: tesis de grado
Fecha de Publicación:2026
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/11967
Enlace del recurso:https://hdl.handle.net/20.500.12918/11967
Nivel de acceso:acceso abierto
Materia:Big data
Inteligencia artificial
Web scraping
ETL
https://purl.org/pe-repo/ocde/ford#1.02.02
Descripción
Sumario:En el presente trabajo de investigación se aplica un conjunto de técnicas de Big Data: Data Lake, Web Scraping, ETL (Extracción, Transformación y Carga de datos) y de Inteligencia Artificial (particularmente Machine Learning) con el propósito de mejorar la capacidad analítica de la Gerencia Comercial de EGEMSA. El problema principal radica en la ineficiencia de la recolección de datos del mercado eléctrico peruano, la deficiente consolidación y organización de estos datos y la limitada aplicación de herramientas avanzadas que permitan identificar patrones. Para abordar la problemática, se propone una arquitectura basada en Data Lake con capas Bronce, Plata y Oro, a fin de optimizar el flujo de la información su organización y posterior análisis. Además, se emplean algoritmos de clústeres(segmentación) para categorizar a los clientes de EGEMSA y facilitar la toma de decisiones basadas en datos confiables y oportunos. Los resultados evidencian una reducción significativa en los tiempos de procesamiento y mayor precisión en la identificación de oportunidades comerciales. Finalmente, se plantean recomendaciones para la automatización y el desplieguen producción de los modelos de clustering, asegurando la sostenibilidad de la solución en el largo plazo.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).