Aplicación de técnicas de Big Data e inteligencia artificial para mejorar la capacidad analítica de EGEMSA
Descripción del Articulo
En el presente trabajo de investigación se aplica un conjunto de técnicas de Big Data: Data Lake, Web Scraping, ETL (Extracción, Transformación y Carga de datos) y de Inteligencia Artificial (particularmente Machine Learning) con el propósito de mejorar la capacidad analítica de la Gerencia Comercia...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2026 |
| Institución: | Universidad Nacional de San Antonio Abad del Cusco |
| Repositorio: | UNSAAC-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsaac.edu.pe:20.500.12918/11967 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12918/11967 |
| Nivel de acceso: | acceso abierto |
| Materia: | Big data Inteligencia artificial Web scraping ETL https://purl.org/pe-repo/ocde/ford#1.02.02 |
| Sumario: | En el presente trabajo de investigación se aplica un conjunto de técnicas de Big Data: Data Lake, Web Scraping, ETL (Extracción, Transformación y Carga de datos) y de Inteligencia Artificial (particularmente Machine Learning) con el propósito de mejorar la capacidad analítica de la Gerencia Comercial de EGEMSA. El problema principal radica en la ineficiencia de la recolección de datos del mercado eléctrico peruano, la deficiente consolidación y organización de estos datos y la limitada aplicación de herramientas avanzadas que permitan identificar patrones. Para abordar la problemática, se propone una arquitectura basada en Data Lake con capas Bronce, Plata y Oro, a fin de optimizar el flujo de la información su organización y posterior análisis. Además, se emplean algoritmos de clústeres(segmentación) para categorizar a los clientes de EGEMSA y facilitar la toma de decisiones basadas en datos confiables y oportunos. Los resultados evidencian una reducción significativa en los tiempos de procesamiento y mayor precisión en la identificación de oportunidades comerciales. Finalmente, se plantean recomendaciones para la automatización y el desplieguen producción de los modelos de clustering, asegurando la sostenibilidad de la solución en el largo plazo. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).