Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop

Descripción del Articulo

La propuesta del presente trabajo de investigación es diseñar e implementar una arquitectura homogénea y heterogénea basado en el framework Hadoop, bajo el modelo cliente/servidor en base a Hardware Commodity, generando así clúster homogénea y heterogénea. Dichos clústeres son tolerantes a fallos, a...

Descripción completa

Detalles Bibliográficos
Autor: Huancahuire Bravo, Claudio Isaias
Formato: tesis de maestría
Fecha de Publicación:2021
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/5901
Enlace del recurso:http://hdl.handle.net/20.500.12918/5901
Nivel de acceso:acceso abierto
Materia:Big data
MapReduce
No estructurado
Nodos
http://purl.org/pe-repo/ocde/ford#1.02.02
id RUNS_4a27fa8ed41912008a1ce31890d6a100
oai_identifier_str oai:repositorio.unsaac.edu.pe:20.500.12918/5901
network_acronym_str RUNS
network_name_str UNSAAC-Institucional
repository_id_str
spelling Rozas Huacho, Javier ArturoHuancahuire Bravo, Claudio Isaias2021-09-02T23:35:27Z2021-09-02T23:35:27Z2021253T20211022http://hdl.handle.net/20.500.12918/5901La propuesta del presente trabajo de investigación es diseñar e implementar una arquitectura homogénea y heterogénea basado en el framework Hadoop, bajo el modelo cliente/servidor en base a Hardware Commodity, generando así clúster homogénea y heterogénea. Dichos clústeres son tolerantes a fallos, acoplado su parte lógica con el modelo de programación MapReduce y luego almacenar los datos no estructurados en sistema de archivos distribuidos HDFS ubicados en nodos esclavos y dichos nodos al ser adicionados con memoria RAM, disco duro y E/S entrada/salida de datos hace que los tiempos de rendimiento disminuya tanto en clúster homogénea y heterogénea que permite procesar grandes volúmenes de datos con la función Map que convierte en números de pares clave/valor y la función Reduce procesa las tuplas clave/valor que llegan de la función Map los reduce para su salida final. La mejora de esta arquitectura con Framework Apache Hadoop es YARN (otro Administrador de recursos que mejora la versión anterior) por parte de Hadoop versión 2, que coordina exclusivamente los recursos del clúster y administra que bloques se distribuyen en discos locales los nodos esclavos y por último el almacenamiento en HDFS (Sistema de Archivos Distribuidos sobre Hadoop) que es donde se almacena los bloques y réplicas en cada nodo esclavo y el aprovisionamiento, administración y monitoreo de todo la arquitectura en conjunto como uno solo servidor-clúster. Logrando la característica escalable horizontalmente en arquitectura homogénea y heterogénea.application/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Big dataMapReduceNo estructuradoNodoshttp://purl.org/pe-repo/ocde/ford#1.02.02Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoopinfo:eu-repo/semantics/masterThesisreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACSUNEDUMaestro en Ciencias mención InformáticaUniversidad Nacional de San Antonio Abad del Cusco. Escuela de PosgradoMaestría en Ciencias mención Informática4273478623847232http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#maestro611027Enciso Rodas, LauroSoncco Alvarez, Jose LuisVillafuerte Serna, RonyChullo Llave, BorisORIGINAL253T20211022_TC.pdfapplication/pdf3456643http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5901/1/253T20211022_TC.pdf32036cdec35054a0819de11c264dc4f6MD5120.500.12918/5901oai:repositorio.unsaac.edu.pe:20.500.12918/59012021-09-02 18:53:37.524DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe
dc.title.es_PE.fl_str_mv Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
title Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
spellingShingle Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
Huancahuire Bravo, Claudio Isaias
Big data
MapReduce
No estructurado
Nodos
http://purl.org/pe-repo/ocde/ford#1.02.02
title_short Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
title_full Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
title_fullStr Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
title_full_unstemmed Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
title_sort Arquitectura homogénea y heterogénea para el procesamiento distribuido de datos no estructurados con Framework Hadoop
author Huancahuire Bravo, Claudio Isaias
author_facet Huancahuire Bravo, Claudio Isaias
author_role author
dc.contributor.advisor.fl_str_mv Rozas Huacho, Javier Arturo
dc.contributor.author.fl_str_mv Huancahuire Bravo, Claudio Isaias
dc.subject.es_PE.fl_str_mv Big data
MapReduce
No estructurado
Nodos
topic Big data
MapReduce
No estructurado
Nodos
http://purl.org/pe-repo/ocde/ford#1.02.02
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#1.02.02
description La propuesta del presente trabajo de investigación es diseñar e implementar una arquitectura homogénea y heterogénea basado en el framework Hadoop, bajo el modelo cliente/servidor en base a Hardware Commodity, generando así clúster homogénea y heterogénea. Dichos clústeres son tolerantes a fallos, acoplado su parte lógica con el modelo de programación MapReduce y luego almacenar los datos no estructurados en sistema de archivos distribuidos HDFS ubicados en nodos esclavos y dichos nodos al ser adicionados con memoria RAM, disco duro y E/S entrada/salida de datos hace que los tiempos de rendimiento disminuya tanto en clúster homogénea y heterogénea que permite procesar grandes volúmenes de datos con la función Map que convierte en números de pares clave/valor y la función Reduce procesa las tuplas clave/valor que llegan de la función Map los reduce para su salida final. La mejora de esta arquitectura con Framework Apache Hadoop es YARN (otro Administrador de recursos que mejora la versión anterior) por parte de Hadoop versión 2, que coordina exclusivamente los recursos del clúster y administra que bloques se distribuyen en discos locales los nodos esclavos y por último el almacenamiento en HDFS (Sistema de Archivos Distribuidos sobre Hadoop) que es donde se almacena los bloques y réplicas en cada nodo esclavo y el aprovisionamiento, administración y monitoreo de todo la arquitectura en conjunto como uno solo servidor-clúster. Logrando la característica escalable horizontalmente en arquitectura homogénea y heterogénea.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-09-02T23:35:27Z
dc.date.available.none.fl_str_mv 2021-09-02T23:35:27Z
dc.date.issued.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.other.none.fl_str_mv 253T20211022
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12918/5901
identifier_str_mv 253T20211022
url http://hdl.handle.net/20.500.12918/5901
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.en_US.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:UNSAAC-Institucional
instname:Universidad Nacional de San Antonio Abad del Cusco
instacron:UNSAAC
instname_str Universidad Nacional de San Antonio Abad del Cusco
instacron_str UNSAAC
institution UNSAAC
reponame_str UNSAAC-Institucional
collection UNSAAC-Institucional
bitstream.url.fl_str_mv http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5901/1/253T20211022_TC.pdf
bitstream.checksum.fl_str_mv 32036cdec35054a0819de11c264dc4f6
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv DSpace de la UNSAAC
repository.mail.fl_str_mv soporte.repositorio@unsaac.edu.pe
_version_ 1742881459721469952
score 13.927358
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).