Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source
Descripción del Articulo
Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2019 |
| Institución: | Universidad Andina Néstor Cáceres Velasquez |
| Repositorio: | UANCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uancv.edu.pe:UANCV/2261 |
| Enlace del recurso: | http://repositorio.uancv.edu.pe/handle/UANCV/2261 |
| Nivel de acceso: | acceso abierto |
| Materia: | Almacén de datos, Inteligencia de Negocios |
| Sumario: | Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho.. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).