Acelerando el tiempo de busqueda en consultas de tipo Timebox en series de tiempo usando el Segment Buddy Tree con Range Maximun-Minimum Query
Descripción del Articulo
Las series de tiempo son esenciales en una variedad de campos, incluidas las finanzas, la meteorología, la salud y la informática urbana, entre otros. Estos datos se generan y almacenan a un ritmo cada vez mayor. Los analistas generalmente necesitan explorar, comparar y relacionar los datos de múlti...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad Católica San Pablo |
| Repositorio: | UCSP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucsp.edu.pe:20.500.12590/18540 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12590/18540 |
| Nivel de acceso: | acceso abierto |
| Materia: | Timebox Series de tiempo Buddy Tree Consulta máxima de rango Consulta mínima de rango Búsqueda de rango ortogonal https://purl.org/pe-repo/ocde/ford#1.02.01 |
| Sumario: | Las series de tiempo son esenciales en una variedad de campos, incluidas las finanzas, la meteorología, la salud y la informática urbana, entre otros. Estos datos se generan y almacenan a un ritmo cada vez mayor. Los analistas generalmente necesitan explorar, comparar y relacionar los datos de múltiples series de tiempo cuyos números pueden oscilar desde las decenas hasta los millares; por ejemplo, múltiples acciones de la bolsa de valores, consumo de energía de las máquinas, etc. llegando a ser millones de datos a explorar. Actualmente, existe una gran demanda para la exploración de datos de series de tiempo a gran escala. Sin embargo, las consultas usadas han demostrado tener un tiempo linealmente proporcional al tamaño de las series de tiempo, lo que las hace poco prácticas. Una de estas consultas difíciles es la consulta de tipo Timebox. En esta investigación, proponemos acelerar la consulta de tipo Timebox haciendo uso de la estructura de datos Buddy Tree y filtrando los resultados con consultas de Range Minimum/Maximum Query (RMQ). Este tipo de búsqueda ha sido recientemente abordado; a diferencia de los resultados obtenidos por el KD-Box, nuestros resultados son obtenidos a partir del conjunto total de datos y no con aproximaciones de las series de tiempo, esto elimina la posibilidad de obtener series que no pertenecen al Timebox y series de tiempo que perteneciendo no son encontradas por el método de búsqueda. Para comprobar nuestras hipótesis realizamos un conjunto de experimentos que evidencian la eficiencia de nuestra propuesta |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).