Clasificación de datos basado en compresión

Descripción del Articulo

The increased volume of data in this digital age is enormous, the task of analyzing, processing, identifying and classify them for to have a good data mining system where we can index the information contained regardless the amount and data type, it is no easy task. That is the reason for it is beco...

Descripción completa

Detalles Bibliográficos
Autor: Roman Gonzalez, Avid
Formato: artículo
Fecha de Publicación:2019
Institución:Centro de Preparación para la Ciencia y Tecnología
Repositorio:ECIPERÚ
Lenguaje:español
OAI Identifier:oai:revistas.eciperu.net:article/169
Enlace del recurso:https://revistas.eciperu.net/index.php/ECIPERU/article/view/169
Nivel de acceso:acceso abierto
Materia:clasificación, NCD, compresión de datos, similaridad métrica
classification, NCD, data compression, metric similarity
id REVCEPRE_6034a556c18983e741cb7b2b59b75b26
oai_identifier_str oai:revistas.eciperu.net:article/169
network_acronym_str REVCEPRE
network_name_str ECIPERÚ
repository_id_str
spelling Clasificación de datos basado en compresiónRoman Gonzalez, Avidclasificación, NCD, compresión de datos, similaridad métricaclassification, NCD, data compression, metric similarityThe increased volume of data in this digital age is enormous, the task of analyzing, processing, identifying and classify them for to have a good data mining system where we can index the information contained regardless the amount and data type, it is no easy task. That is the reason for it is becoming more necessary to develop more effective methods to facilitate these tasks automatically. This paper presents an overview of different works performed throughout the world that use data compression techniques as a basis for developing a classification method, these techniques are based on Kolmogorov Complexity and use this complexity for implement a similarity metrics between data. The main contribution of these methods is, no need a feature extraction process for classification, which makes it a parameter-free method, so it can be applied to any type of data, whether text, images, audio, etc.El incremento del volumen de datos en esta era digital es enorme, la tarea de analizarlos, procesarlos, identificarlos para luego poder clasificarlos y así tener un buen sistema de minería de datos donde poder indexar la información que contienen sin importar la cantidad y el tipo de dato, resulta una tarea nada fácil. Debido a esto, cada vez se hace más necesario el desarrollo de métodos más efectivos que faciliten estas tareas de manera automática. En este articulo se presenta un vista general de diferentes trabajos realizados a lo largo del mundo que utilizan técnicas de compresión de datos como base para el desarrollo de un método de clasificación, estas técnicas se basan en la Complejidad de Kolmogorov y la utilización de esta para implementar una medida de similaridad entre datos. El aporte principal de estos métodos es la no necesidad de un proceso de extracción de características para realizar la clasificación, lo cual hace que sea un método libre de parámetros, por lo que se puede aplicar a cualquier tipo de datos, ya sean texto, imágenes, audio, etc.Centro de Preparación para la Ciencia y Tecnología (Ceprecyt)2019-01-08info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://revistas.eciperu.net/index.php/ECIPERU/article/view/16910.33017/RevECIPeru2012.0012/Revista ECIPerú; Vol. 9 Núm. 1 (2012); 61813-0194reponame:ECIPERÚinstname:Centro de Preparación para la Ciencia y Tecnologíainstacron:CEPRECYTspahttps://revistas.eciperu.net/index.php/ECIPERU/article/view/169/161Derechos de autor 2012 Revista ECIPerúinfo:eu-repo/semantics/openAccessoai:revistas.eciperu.net:article/1692019-01-08T14:52:45Z
dc.title.none.fl_str_mv Clasificación de datos basado en compresión
title Clasificación de datos basado en compresión
spellingShingle Clasificación de datos basado en compresión
Roman Gonzalez, Avid
clasificación, NCD, compresión de datos, similaridad métrica
classification, NCD, data compression, metric similarity
title_short Clasificación de datos basado en compresión
title_full Clasificación de datos basado en compresión
title_fullStr Clasificación de datos basado en compresión
title_full_unstemmed Clasificación de datos basado en compresión
title_sort Clasificación de datos basado en compresión
dc.creator.none.fl_str_mv Roman Gonzalez, Avid
author Roman Gonzalez, Avid
author_facet Roman Gonzalez, Avid
author_role author
dc.subject.none.fl_str_mv clasificación, NCD, compresión de datos, similaridad métrica
classification, NCD, data compression, metric similarity
topic clasificación, NCD, compresión de datos, similaridad métrica
classification, NCD, data compression, metric similarity
description The increased volume of data in this digital age is enormous, the task of analyzing, processing, identifying and classify them for to have a good data mining system where we can index the information contained regardless the amount and data type, it is no easy task. That is the reason for it is becoming more necessary to develop more effective methods to facilitate these tasks automatically. This paper presents an overview of different works performed throughout the world that use data compression techniques as a basis for developing a classification method, these techniques are based on Kolmogorov Complexity and use this complexity for implement a similarity metrics between data. The main contribution of these methods is, no need a feature extraction process for classification, which makes it a parameter-free method, so it can be applied to any type of data, whether text, images, audio, etc.
publishDate 2019
dc.date.none.fl_str_mv 2019-01-08
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.eciperu.net/index.php/ECIPERU/article/view/169
10.33017/RevECIPeru2012.0012/
url https://revistas.eciperu.net/index.php/ECIPERU/article/view/169
identifier_str_mv 10.33017/RevECIPeru2012.0012/
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.eciperu.net/index.php/ECIPERU/article/view/169/161
dc.rights.none.fl_str_mv Derechos de autor 2012 Revista ECIPerú
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Derechos de autor 2012 Revista ECIPerú
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Centro de Preparación para la Ciencia y Tecnología (Ceprecyt)
publisher.none.fl_str_mv Centro de Preparación para la Ciencia y Tecnología (Ceprecyt)
dc.source.none.fl_str_mv Revista ECIPerú; Vol. 9 Núm. 1 (2012); 6
1813-0194
reponame:ECIPERÚ
instname:Centro de Preparación para la Ciencia y Tecnología
instacron:CEPRECYT
instname_str Centro de Preparación para la Ciencia y Tecnología
instacron_str CEPRECYT
institution CEPRECYT
reponame_str ECIPERÚ
collection ECIPERÚ
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1846518775771299840
score 13.394457
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).