Optimización de métodos radiales de exploración de datos multidimensionales a través de algoritmos de aprendizaje máquina
Descripción del Articulo
El descubrimiento de patrones en conjuntos de datos despierta gran interés en la comunidad de investigadores. Específicamente, en el manejo de datos multidimensionales o datos de alta dimensión se han realizado grandes avances. Sin embargo, todavía existen ciertas limitaciones como: costo computacio...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2017 |
Institución: | Universidad Nacional de San Antonio Abad del Cusco |
Repositorio: | UNSAAC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsaac.edu.pe:20.500.12918/3932 |
Enlace del recurso: | http://hdl.handle.net/20.500.12918/3932 |
Nivel de acceso: | acceso cerrado |
Materia: | Visualización de información Datos multidimensionales Star coordinates Radviz Barycentric coordinates http://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | El descubrimiento de patrones en conjuntos de datos despierta gran interés en la comunidad de investigadores. Específicamente, en el manejo de datos multidimensionales o datos de alta dimensión se han realizado grandes avances. Sin embargo, todavía existen ciertas limitaciones como: costo computacional, falta de percepción visual y la interacción con el usuario que impiden que la tarea de extracción de patrones y agrupamientos sea simple y eficiente. El grupo de técnicas que mitigan estos problemas son los denominados Técnicas de Visualización Radial (Star Coordinates, Radviz, Barycentric Coordinates), los cuales son capaces de revelar patrones y grupos de datos multidimensionales mientras muestran el impacto de los atributos en la formación de la representación de los datos. A pesar de su utilidad, las técnicas de exploración radial tienen ciertos inconvenientes que impiden su uso en varios escenarios. Por ejemplo, cuando el número de dimensiones de los datos es realmente alto, las visualizaciones resultantes se vuelven desordenadas y sobrecargadas, lo que dificulta el análisis de la importancia de los atributos en la formación de grupos y/o patrones. En este trabajo de investigación se optimiza las técnicas de visualización radial aprovechando sus ventajas (interacción y bajo costo computacional) y fortaleciendo sus deficiencias (manejo de datos con un numero alto de dimensiones) en el análisis de datos multidimensionales. La optimización de estas técnicas se cimienta en el agrupamiento (similaridad de atributos) y reordenamiento de atributos (optimización de ubicación) con el _n de mitigar la distorsión visual. El agrupamiento y reordenamiento se puede realizar de forma automática, así como de forma interactiva, lo que permite que el usuario pueda analizar a un mas el impacto de los atributos en la visualización radial. La eficacia de los enfoques presentados se muestran a través de una serie de experimentos y estudios de caso, los cuales evidencian utilidad de la propuesta. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).