Modelo de un Data lake en la nube para la automatización del proceso de medición de envíos de campañas de un homecenter basada en la metodología Mambo

Descripción del Articulo

En este trabajo se propone una solución para un caso de análisis de información generada en las plataformas de un Homecenter del área de marketing, que actualmente tiene como repositorio de datos a un data warehouse y base de datos con información solo estructurada, esta solución incorpora tecnologí...

Descripción completa

Detalles Bibliográficos
Autor: Perales Barrios, Yosselin Vanessa
Formato: tesis de maestría
Fecha de Publicación:2023
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/16906
Enlace del recurso:https://hdl.handle.net/20.500.12773/16906
Nivel de acceso:acceso abierto
Materia:Big data
Google Cloud Plataforma
ciclo vida del dato
vida del dato, arquitectura data lake
Metodología Mambo
https://purl.org/pe-repo/ocde/ford#5.02.04
Descripción
Sumario:En este trabajo se propone una solución para un caso de análisis de información generada en las plataformas de un Homecenter del área de marketing, que actualmente tiene como repositorio de datos a un data warehouse y base de datos con información solo estructurada, esta solución incorpora tecnologías de big data en cloud, mediante el diseño e implementación de una arquitectura de data lake en Google cloud con sus servicios para cubrir las fases del ciclo de vida del dato mediante la metodología Mambo, con el fin de procesar, almacenar, disponibilizar la información y generar visualizaciones para la posterior toma de decisiones, logrando consolidar, integrar y actualizar la data para los procesos que tiene un Homecenter. A su vez, se identifica como problemática la falta de acceso, centralización, e integración de información que impacta en el proceso de medición de envíos de las campañas de marketing, compra de productos y servicios del Homecenter. También se necesita incorporar técnicas de analítica avanzada sin la necesidad de navegar por diferentes repositorios teniendo todos los datos centralizados y disponibles, con el objetivo de que el Homecenter siga siendo competitivo en el contexto de la transformación digital que las empresas llevan a cabo hoy en día. Por ende, se analiza el nuevo paradigma de Data Lake que las empresas deberían adoptar para seguir siendo competitivas, en particular pequeñas y medianas empresas que actualmente poseen soluciones de data warehouse (EDW), y se propone la adopción de tecnologías de big data y procesamiento en la nube para que un cliente hipotético pueda adecuarse al nuevo escenario.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).