Optimización de métodos radiales de exploración de datos multidimensionales a través de algoritmos de aprendizaje máquina

Descripción del Articulo

El descubrimiento de patrones en conjuntos de datos despierta gran interés en la comunidad de investigadores. Específicamente, en el manejo de datos multidimensionales o datos de alta dimensión se han realizado grandes avances. Sin embargo, todavía existen ciertas limitaciones como: costo computacio...

Descripción completa

Detalles Bibliográficos
Autor: García Zanabria, Germain
Formato: tesis de grado
Fecha de Publicación:2017
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/3932
Enlace del recurso:http://hdl.handle.net/20.500.12918/3932
Nivel de acceso:acceso cerrado
Materia:Visualización de información
Datos multidimensionales
Star coordinates
Radviz
Barycentric coordinates
http://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El descubrimiento de patrones en conjuntos de datos despierta gran interés en la comunidad de investigadores. Específicamente, en el manejo de datos multidimensionales o datos de alta dimensión se han realizado grandes avances. Sin embargo, todavía existen ciertas limitaciones como: costo computacional, falta de percepción visual y la interacción con el usuario que impiden que la tarea de extracción de patrones y agrupamientos sea simple y eficiente. El grupo de técnicas que mitigan estos problemas son los denominados Técnicas de Visualización Radial (Star Coordinates, Radviz, Barycentric Coordinates), los cuales son capaces de revelar patrones y grupos de datos multidimensionales mientras muestran el impacto de los atributos en la formación de la representación de los datos. A pesar de su utilidad, las técnicas de exploración radial tienen ciertos inconvenientes que impiden su uso en varios escenarios. Por ejemplo, cuando el número de dimensiones de los datos es realmente alto, las visualizaciones resultantes se vuelven desordenadas y sobrecargadas, lo que dificulta el análisis de la importancia de los atributos en la formación de grupos y/o patrones. En este trabajo de investigación se optimiza las técnicas de visualización radial aprovechando sus ventajas (interacción y bajo costo computacional) y fortaleciendo sus deficiencias (manejo de datos con un numero alto de dimensiones) en el análisis de datos multidimensionales. La optimización de estas técnicas se cimienta en el agrupamiento (similaridad de atributos) y reordenamiento de atributos (optimización de ubicación) con el _n de mitigar la distorsión visual. El agrupamiento y reordenamiento se puede realizar de forma automática, así como de forma interactiva, lo que permite que el usuario pueda analizar a un mas el impacto de los atributos en la visualización radial. La eficacia de los enfoques presentados se muestran a través de una serie de experimentos y estudios de caso, los cuales evidencian utilidad de la propuesta.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).