Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source
Descripción del Articulo
Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2019 |
| Institución: | Universidad Andina Néstor Cáceres Velasquez |
| Repositorio: | UANCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.uancv.edu.pe:UANCV/2261 |
| Enlace del recurso: | http://repositorio.uancv.edu.pe/handle/UANCV/2261 |
| Nivel de acceso: | acceso abierto |
| Materia: | Almacén de datos, Inteligencia de Negocios |
| id |
UANT_bb09e31458286eaae7ba851aa9c44f3d |
|---|---|
| oai_identifier_str |
oai:repositorio.uancv.edu.pe:UANCV/2261 |
| network_acronym_str |
UANT |
| repository_id_str |
9395 |
| network_name_str |
UANCV-Institucional |
| dc.title.es_ES.fl_str_mv |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| title |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| spellingShingle |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source Dueñas Bustinza, Darío Francisco Almacén de datos, Inteligencia de Negocios |
| title_short |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| title_full |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| title_fullStr |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| title_full_unstemmed |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| title_sort |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| author |
Dueñas Bustinza, Darío Francisco |
| author_facet |
Dueñas Bustinza, Darío Francisco |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Jara Paredes, Max Alí |
| dc.contributor.author.fl_str_mv |
Dueñas Bustinza, Darío Francisco |
| dc.subject.es_ES.fl_str_mv |
Almacén de datos, Inteligencia de Negocios |
| topic |
Almacén de datos, Inteligencia de Negocios |
| dc.description.abstract.es_ES.fl_txt_mv |
Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho.. |
| dc.description.uri.es_ES.fl_txt_mv |
Tesis |
| description |
Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho.. |
| publishDate |
2019 |
| dc.date.accessioned.none.fl_str_mv |
2019-02-25T21:12:58Z 2019-06-27T22:29:45Z |
| dc.date.available.none.fl_str_mv |
2019-02-25T21:12:58Z 2019-06-27T22:29:45Z |
| dc.date.issued.fl_str_mv |
2019 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.citation.es_ES.fl_str_mv |
VANCOUVER |
| dc.identifier.uri.none.fl_str_mv |
http://repositorio.uancv.edu.pe/handle/UANCV/2261 |
| identifier_str_mv |
VANCOUVER |
| url |
http://repositorio.uancv.edu.pe/handle/UANCV/2261 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_ES.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
| dc.format.es_ES.fl_str_mv |
application/pdf |
| dc.publisher.es_ES.fl_str_mv |
Universidad Andina Néstor Cáceres Velásquez |
| dc.source.es_ES.fl_str_mv |
Universidad Andina Néstor Cáceres Velásquez Repositorio institucional - UANCV |
| dc.source.none.fl_str_mv |
reponame:UANCV-Institucional instname:Universidad Andina Néstor Cáceres Velasquez instacron:UANCV Universidad Andina Néstor Cáceres Velásquez Repositorio institucional - UANCV |
| reponame_str |
UANCV-Institucional |
| collection |
UANCV-Institucional |
| instname_str |
Universidad Andina Néstor Cáceres Velasquez |
| instacron_str |
UANCV |
| institution |
UANCV |
| bitstream.url.fl_str_mv |
http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/1/T036_41156068.pdf.txt http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/2/license.txt http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/3/T036_41156068.pdf |
| bitstream.checksum.fl_str_mv |
b37f2a4a8f534f97c734cbc40d69ce5d 8a4605be74aa9ea9d79846c1fba20a33 abd06c9020cfe9e738a5b26adab193a3 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la UANCV |
| repository.mail.fl_str_mv |
repositorio@uancv.edu.pe |
| dc.description.abstract.none.fl_txt_mv |
Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho.. |
| dc.contributor.none.fl_str_mv |
Jara Paredes, Max Alí Dueñas Bustinza, Darío Francisco |
| dc.date.none.fl_str_mv |
2019 |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Andina Néstor Cáceres Velásquez |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.subject.none.fl_str_mv |
Almacén de datos, Inteligencia de Negocios |
| dc.title.none.fl_str_mv |
Optimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Source |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.relation.none.fl_str_mv |
SUNEDU |
| dc.identifier.citation.none.fl_str_mv |
VANCOUVER |
| dc.language.iso.none.fl_str_mv |
spa |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
| thesis.degree.name.none.fl_str_mv |
Magíster en Ingenieria de Sistemas |
| thesis.degree.grantor.none.fl_str_mv |
Universidad Andina Néstor Cáceres Velásquez. Escuela de Posgrado |
| thesis.degree.level.none.fl_str_mv |
Maestria |
| thesis.degree.discipline.none.fl_str_mv |
Escuela de Posgrado |
| thesis.degree.program.none.fl_str_mv |
Presencial |
| _version_ |
1708735272365064192 |
| spelling |
Jara Paredes, Max AlíDueñas Bustinza, Darío Francisco2019-02-25T21:12:58Z2019-06-27T22:29:45Z2019-02-25T21:12:58Z2019-06-27T22:29:45Z2019VANCOUVERhttp://repositorio.uancv.edu.pe/handle/UANCV/2261Dentro de la metodología MAPIN para inteligencia en los negocios una, etapa fundamental, es el preprocesado de los datos para luego poder construir el almacén de datos. El objetivo de la investigación es optimizar la fase de extracción trasformación y carga de datos mediante la suite de herramientas pentaho. Se usó la metodología MAPIN para desarrollar el proyecto de inteligencia en los negocios empleando PENTAHO para ello se empleó las herramientas que provee la suite para realizar un fase óptimo de limpieza de datos ya que esta herramienta provee varias funcionalidades para ello. Como resultado se logró construir el almacén de datos empleando PDI, SPoon cono herramientas de la suite Pentaho que a pesar de no ser herramientas de limpieza de datos ofrecen la suficiente funcionalidad para ello. En conclusión, se optimizó la fase de extracción transformación y carga para lograr un buen almacén de datos empleando Pentaho..Tesisapplication/pdfspaUniversidad Andina Néstor Cáceres Velásquezinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Andina Néstor Cáceres VelásquezRepositorio institucional - UANCVreponame:UANCV-Institucionalinstname:Universidad Andina Néstor Cáceres Velasquezinstacron:UANCVAlmacén de datos, Inteligencia de NegociosOptimización en el Proceso de Limpieza de datos para la Construcción de un DATAWAREHOUSE usando herramientas Open Sourceinfo:eu-repo/semantics/masterThesisSUNEDUMagíster en Ingenieria de SistemasUniversidad Andina Néstor Cáceres Velásquez. Escuela de PosgradoMaestriaEscuela de PosgradoPresencialTEXTT036_41156068.pdf.txtExtracted texttext/plain68480http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/1/T036_41156068.pdf.txtb37f2a4a8f534f97c734cbc40d69ce5dMD51LICENSElicense.txttext/plain1748http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALT036_41156068.pdfapplication/pdf7235718http://repositorio.uancv.edu.pe/bitstream/UANCV/2261/3/T036_41156068.pdfabd06c9020cfe9e738a5b26adab193a3MD53UANCV/2261oai:repositorio.uancv.edu.pe:UANCV/22612021-03-03 12:58:34.21Repositorio Institucional de la UANCVrepositorio@uancv.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.92932 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).