Implementación de una plataforma big data para el estudio de casos de anemia en América Latina

Descripción del Articulo

El acelerado avance de las tecnologías de la información en diversos entornos, así como en las plataformas móviles, ha generado que se puedan manejar grandes volúmenes de datos en tiempo real, por esta razón la presente tesis tuvo como objetivo general de implementar una plataforma de big data para...

Descripción completa

Detalles Bibliográficos
Autor: Bustamante Rojas, Rosario
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/13491
Enlace del recurso:http://repositorio.unap.edu.pe/handle/20.500.14082/13491
Nivel de acceso:acceso abierto
Materia:Ingeniería de Software
Big Data
Descripción
Sumario:El acelerado avance de las tecnologías de la información en diversos entornos, así como en las plataformas móviles, ha generado que se puedan manejar grandes volúmenes de datos en tiempo real, por esta razón la presente tesis tuvo como objetivo general de implementar una plataforma de big data para el estudio de casos de anemia en América Latina, 2018. Se realizó la implementación de la plataforma de Big Data definiendo una metodología mediante un diseño que utiliza como principal herramienta Cloudera, una distribución de Linux, en la cual se realizó la configuración del agente Flume para iniciar con el streaming o transmisión de información disponible para la APIREST de Twitter, se utilizó HDFS(Hadoop Data File System, Sistema de Archivos para Hadoop) para el almacenamiento de información en Hadoop, para el mapeo y reducción de información se utilizó MapReduce, como bases de datos y procesamiento de la información, se cargó la información en Hive y MySql, de esa forma se demuestra que es posible utilizar tecnología de forma híbrida y para la visualización de gráficos en Excel. De esta manera se puede concluir que los términos encontrados son semejantes a los buscados, con 7,192,687 registros de tweets recolectados, se encontraron 23 veces de la palabra “anemia” que representa el 0.00032% de registros de tweets, esto respecto al 1% disponible de la data disponible en Twitter.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).