Acelerando el tiempo de busqueda en consultas de tipo Timebox en series de tiempo usando el Segment Buddy Tree con Range Maximun-Minimum Query

Descripción del Articulo

Las series de tiempo son esenciales en una variedad de campos, incluidas las finanzas, la meteorología, la salud y la informática urbana, entre otros. Estos datos se generan y almacenan a un ritmo cada vez mayor. Los analistas generalmente necesitan explorar, comparar y relacionar los datos de múlti...

Descripción completa

Detalles Bibliográficos
Autor: Velasquez Rios, Diego Arturo
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/18540
Enlace del recurso:https://hdl.handle.net/20.500.12590/18540
Nivel de acceso:acceso abierto
Materia:Timebox
Series de tiempo
Buddy Tree
Consulta máxima de rango
Consulta mínima de rango
Búsqueda de rango ortogonal
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:Las series de tiempo son esenciales en una variedad de campos, incluidas las finanzas, la meteorología, la salud y la informática urbana, entre otros. Estos datos se generan y almacenan a un ritmo cada vez mayor. Los analistas generalmente necesitan explorar, comparar y relacionar los datos de múltiples series de tiempo cuyos números pueden oscilar desde las decenas hasta los millares; por ejemplo, múltiples acciones de la bolsa de valores, consumo de energía de las máquinas, etc. llegando a ser millones de datos a explorar. Actualmente, existe una gran demanda para la exploración de datos de series de tiempo a gran escala. Sin embargo, las consultas usadas han demostrado tener un tiempo linealmente proporcional al tamaño de las series de tiempo, lo que las hace poco prácticas. Una de estas consultas difíciles es la consulta de tipo Timebox. En esta investigación, proponemos acelerar la consulta de tipo Timebox haciendo uso de la estructura de datos Buddy Tree y filtrando los resultados con consultas de Range Minimum/Maximum Query (RMQ). Este tipo de búsqueda ha sido recientemente abordado; a diferencia de los resultados obtenidos por el KD-Box, nuestros resultados son obtenidos a partir del conjunto total de datos y no con aproximaciones de las series de tiempo, esto elimina la posibilidad de obtener series que no pertenecen al Timebox y series de tiempo que perteneciendo no son encontradas por el método de búsqueda. Para comprobar nuestras hipótesis realizamos un conjunto de experimentos que evidencian la eficiencia de nuestra propuesta
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).