1
tesis de grado
Esta investigación tiene como objetivo el estudio de la compresión de texto plano mediante la codificación aritmética. Se propone una lista de archivos para evaluar los algoritmos de compresión presentados. Se determinó que el símbolo más frecuente de esta lista es “e”. La idea original de la compresion aritmética no es factible de implementar directamente al ordenador debido a error de redondeo y error de truncamiento. Se explica el proceso de la abstracción haciendo uso de operaciones aritméticas enteras mediante un ejemplo. Los resultados obtenidos indican que los codificadores influyen en el tiempo de compresión, mas no en la tasa de compresión ni tampoco en el coeficiente de variación. El codificador de Moffat y cols. (1998) es rápido en comparación con Witten y cols. (1987). Los modelos estadisticos influyen en la tasa, tiempo de compresión y coeficiente de var...
2
artículo
Common problems in climatological time series data are high dimensionality, correlation between the sequential values and noise due to calibration of meteorological stations influencing dramatically in the quality of clustering, classification, climate pattern finding and data processing. One way to deal with this problem is through feature extraction technique. In order to extract features from large climatological time series data, we propose a feature extraction method based on autoencoder neural network (AUTOE). As a first step, time series is standardized. Then, different architectures of autoencoder is applied on it to reduce dimensionality. Finally, k-means clustering algorithm are used to evaluate them through quality measures. As a result, autoencoder performs well and is competitive with other feature extraction techniques over Synthetic Control Chart Time Series.
3
tesis de maestría
Publicado 2018
Enlace
Enlace
En este trabajo se propone un m´etodo basado en autoencoder para la reducción de la dimensionalidad de series temporales, el cual consiste en la configuración del número de capas y unidades. El método se comparo´ con técnicas de reducción de dimensionalidad lineales y no lineales. Además se provee dos casos de estudio para determinar relaciones en datos climáticos. Es importante la representación adecuada de las series temporales al momento de proceder a analizar con algoritmos de minería de datos y aprendizaje automático. En series temporales hay una diversidad de t´ecnicas de representación que a la vez hacen reducción de dimensionalidad.
4
tesis de maestría
Publicado 2018
Enlace
Enlace
En este trabajo se propone un m´etodo basado en autoencoder para la reducción de la dimensionalidad de series temporales, el cual consiste en la configuración del número de capas y unidades. El método se comparo´ con técnicas de reducción de dimensionalidad lineales y no lineales. Además se provee dos casos de estudio para determinar relaciones en datos climáticos. Es importante la representación adecuada de las series temporales al momento de proceder a analizar con algoritmos de minería de datos y aprendizaje automático. En series temporales hay una diversidad de t´ecnicas de representación que a la vez hacen reducción de dimensionalidad. La representación más simple es considerar las series temporales ya de por sí como vector de características. De acuerdo a nuestro conocimiento, el autoencoder ha sido ampliamente estudiado en imágenes más no en series temporale...
5
artículo
Publicado 2018
Enlace
Enlace
High-dimensional time series analysis through visual techniques poses many challenges due to the visualization solutions proposed until now for exploratory tasks are not well-oriented to high volume of data. When the data sets grow large, the visual alternatives do not allow for a good association between similar time series. With the aim to increase more alternatives, we introduce a visual analytic approach based on Neighbor-Joining similarity tree. The proposed approach internally consists of five time series dimension reduction techniques widely used, two well-known similarity measures and interaction mechanisms to do exploratory analysis of high-dimensional time series data interactively.