Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source

Descripción del Articulo

Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas...

Descripción completa

Detalles Bibliográficos
Autor: Dueñas Bustinza, Darío Francisco
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Andina Néstor Cáceres Velasquez
Repositorio:UANCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uancv.edu.pe:UANCV/2261
Enlace del recurso:http://repositorio.uancv.edu.pe/handle/UANCV/2261
Nivel de acceso:acceso abierto
Materia:Almacén de datos, Inteligencia de Negocios
Descripción
Sumario:Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho..
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).