Una estructura de datos para la consulta visual interactiva por similitud de grandes volúmenes de datos multidimensionales mixtos georeferenciados
Descripción del Articulo
Actualmente, la visualization de big data representa un gran desafío a los analistas. La mixtura y el alto número de dimensiones en los datos, dificulta realizar consultas en tiempo real. Frente a ello, se propone una nueva forma de indizar grandes volúmenes de datos estáticos multidimensionales de...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2021 |
| Institución: | Universidad Católica San Pablo |
| Repositorio: | UCSP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucsp.edu.pe:20.500.12590/17026 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12590/17026 |
| Nivel de acceso: | acceso abierto |
| Materia: | Estructura de Datos Similitud Visualización de big data Consultas interactivas Datos de tipo mixto Multidimensional y georeferenciado https://purl.org/pe-repo/ocde/ford#1.02.01 |
| Sumario: | Actualmente, la visualization de big data representa un gran desafío a los analistas. La mixtura y el alto número de dimensiones en los datos, dificulta realizar consultas en tiempo real. Frente a ello, se propone una nueva forma de indizar grandes volúmenes de datos estáticos multidimensionales de tipos mixtos. Con el propósito de ejecutar simples consultas visuales de similitud sobre estos conjuntos de datos, las cuales estarán asociadas a una ubicación geográfica. Nuestra propuesta presenta una versión inicial donde se utilizó métodos de reducción de dimensionalidad con el propósito de mapear nuestro conjunto de datos a un espacio unidimensional, para luego organizarlos por su similitud. Posteriormente, se desarrolló una siguiente versión, mejorando las desventajas de la anterior. El cual mantiene el cálculo de la matriz de distancias de Gower, pero a partir de este se construye un árbol de similitud, que está conectado a una estructura espacial conocida como QuadTree. Adicionalmente, se presenta un prototipo de análisis exploratorio, que nos permite explotar al máximo las capacidades a ser incluidas en la estructura de datos. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).