Implementación de una plataforma big data para el estudio de casos de anemia en América Latina

Descripción del Articulo

El acelerado avance de las tecnologías de la información en diversos entornos, así como en las plataformas móviles, ha generado que se puedan manejar grandes volúmenes de datos en tiempo real, por esta razón la presente tesis tuvo como objetivo general de implementar una plataforma de big data para...

Descripción completa

Detalles Bibliográficos
Autor: Bustamante Rojas, Rosario
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/13491
Enlace del recurso:http://repositorio.unap.edu.pe/handle/20.500.14082/13491
Nivel de acceso:acceso abierto
Materia:Ingeniería de Software
Big Data
id RNAP_cfb815dcf4b698383a86698dd3895d9d
oai_identifier_str oai:https://repositorio.unap.edu.pe:20.500.14082/13491
network_acronym_str RNAP
network_name_str UNAP-Institucional
repository_id_str 9382
dc.title.es_PE.fl_str_mv Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
title Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
spellingShingle Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
Bustamante Rojas, Rosario
Ingeniería de Software
Big Data
title_short Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
title_full Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
title_fullStr Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
title_full_unstemmed Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
title_sort Implementación de una plataforma big data para el estudio de casos de anemia en América Latina
author Bustamante Rojas, Rosario
author_facet Bustamante Rojas, Rosario
author_role author
dc.contributor.advisor.fl_str_mv Carpio Vargas, Edgar
dc.contributor.author.fl_str_mv Bustamante Rojas, Rosario
dc.subject.es_PE.fl_str_mv Ingeniería de Software
Big Data
topic Ingeniería de Software
Big Data
description El acelerado avance de las tecnologías de la información en diversos entornos, así como en las plataformas móviles, ha generado que se puedan manejar grandes volúmenes de datos en tiempo real, por esta razón la presente tesis tuvo como objetivo general de implementar una plataforma de big data para el estudio de casos de anemia en América Latina, 2018. Se realizó la implementación de la plataforma de Big Data definiendo una metodología mediante un diseño que utiliza como principal herramienta Cloudera, una distribución de Linux, en la cual se realizó la configuración del agente Flume para iniciar con el streaming o transmisión de información disponible para la APIREST de Twitter, se utilizó HDFS(Hadoop Data File System, Sistema de Archivos para Hadoop) para el almacenamiento de información en Hadoop, para el mapeo y reducción de información se utilizó MapReduce, como bases de datos y procesamiento de la información, se cargó la información en Hive y MySql, de esa forma se demuestra que es posible utilizar tecnología de forma híbrida y para la visualización de gráficos en Excel. De esta manera se puede concluir que los términos encontrados son semejantes a los buscados, con 7,192,687 registros de tweets recolectados, se encontraron 23 veces de la palabra “anemia” que representa el 0.00032% de registros de tweets, esto respecto al 1% disponible de la data disponible en Twitter.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2020-02-13T15:47:35Z
dc.date.available.none.fl_str_mv 2020-02-13T15:47:35Z
dc.date.issued.fl_str_mv 2019-02-13
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unap.edu.pe/handle/20.500.14082/13491
url http://repositorio.unap.edu.pe/handle/20.500.14082/13491
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Altiplano
dc.source.es_PE.fl_str_mv Universidad Nacional del Altiplano
Repositorio Institucional - UNAP
dc.source.none.fl_str_mv reponame:UNAP-Institucional
instname:Universidad Nacional Del Altiplano
instacron:UNAP
instname_str Universidad Nacional Del Altiplano
instacron_str UNAP
institution UNAP
reponame_str UNAP-Institucional
collection UNAP-Institucional
bitstream.url.fl_str_mv https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/1/Rosario_Bustamante_Rojas.pdf
https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/2/license.txt
https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/3/Rosario_Bustamante_Rojas.pdf.txt
bitstream.checksum.fl_str_mv d4951a51632b7fac9a6b6db0ea6758f0
c52066b9c50a8f86be96c82978636682
d51d0e88064706431795acd8839d1c71
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional de la Universidad Nacional del Altiplano
repository.mail.fl_str_mv dspace-help@myu.edu
_version_ 1819880797371367424
spelling Carpio Vargas, EdgarBustamante Rojas, Rosario2020-02-13T15:47:35Z2020-02-13T15:47:35Z2019-02-13http://repositorio.unap.edu.pe/handle/20.500.14082/13491El acelerado avance de las tecnologías de la información en diversos entornos, así como en las plataformas móviles, ha generado que se puedan manejar grandes volúmenes de datos en tiempo real, por esta razón la presente tesis tuvo como objetivo general de implementar una plataforma de big data para el estudio de casos de anemia en América Latina, 2018. Se realizó la implementación de la plataforma de Big Data definiendo una metodología mediante un diseño que utiliza como principal herramienta Cloudera, una distribución de Linux, en la cual se realizó la configuración del agente Flume para iniciar con el streaming o transmisión de información disponible para la APIREST de Twitter, se utilizó HDFS(Hadoop Data File System, Sistema de Archivos para Hadoop) para el almacenamiento de información en Hadoop, para el mapeo y reducción de información se utilizó MapReduce, como bases de datos y procesamiento de la información, se cargó la información en Hive y MySql, de esa forma se demuestra que es posible utilizar tecnología de forma híbrida y para la visualización de gráficos en Excel. De esta manera se puede concluir que los términos encontrados son semejantes a los buscados, con 7,192,687 registros de tweets recolectados, se encontraron 23 veces de la palabra “anemia” que representa el 0.00032% de registros de tweets, esto respecto al 1% disponible de la data disponible en Twitter.Tesisapplication/pdfspaUniversidad Nacional del Altiplanoinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Nacional del AltiplanoRepositorio Institucional - UNAPreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPIngeniería de SoftwareBig DataImplementación de una plataforma big data para el estudio de casos de anemia en América Latinainfo:eu-repo/semantics/masterThesisSUNEDUMagíster Scientiae en Informática con mención en Ingeniería de SoftwareInformáticaUniversidad Nacional del Altiplano. Escuela de PosgradoMaestríaORIGINALRosario_Bustamante_Rojas.pdfRosario_Bustamante_Rojas.pdfapplication/pdf3207834https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/1/Rosario_Bustamante_Rojas.pdfd4951a51632b7fac9a6b6db0ea6758f0MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/2/license.txtc52066b9c50a8f86be96c82978636682MD52TEXTRosario_Bustamante_Rojas.pdf.txtRosario_Bustamante_Rojas.pdf.txtExtracted texttext/plain110264https://repositorio.unap.edu.pe/bitstream/20.500.14082/13491/3/Rosario_Bustamante_Rojas.pdf.txtd51d0e88064706431795acd8839d1c71MD5320.500.14082/13491oai:https://repositorio.unap.edu.pe:20.500.14082/134912022-10-29 18:47:51.44Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.edu77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.931064
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).