Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales
Descripción del Articulo
Los datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estu...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2019 |
Institución: | Consejo Nacional de Ciencia Tecnología e Innovación |
Repositorio: | CONCYTEC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.concytec.gob.pe:20.500.12390/1490 |
Enlace del recurso: | https://hdl.handle.net/20.500.12390/1490 |
Nivel de acceso: | acceso abierto |
Materia: | Similitud Datos mixtos Datos multidimensionales Proyecciones multidimensionales https://purl.org/pe-repo/ocde/ford#1.02.01 |
id |
CONC_3eb725b7c89defb02a85e47744a3980b |
---|---|
oai_identifier_str |
oai:repositorio.concytec.gob.pe:20.500.12390/1490 |
network_acronym_str |
CONC |
network_name_str |
CONCYTEC-Institucional |
repository_id_str |
4689 |
dc.title.none.fl_str_mv |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
title |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
spellingShingle |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales Muñoz Salas, Gina Lucia Similitud Datos mixtos Datos multidimensionales Proyecciones multidimensionales https://purl.org/pe-repo/ocde/ford#1.02.01 |
title_short |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
title_full |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
title_fullStr |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
title_full_unstemmed |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
title_sort |
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales |
author |
Muñoz Salas, Gina Lucia |
author_facet |
Muñoz Salas, Gina Lucia |
author_role |
author |
dc.contributor.author.fl_str_mv |
Muñoz Salas, Gina Lucia |
dc.subject.none.fl_str_mv |
Similitud |
topic |
Similitud Datos mixtos Datos multidimensionales Proyecciones multidimensionales https://purl.org/pe-repo/ocde/ford#1.02.01 |
dc.subject.es_PE.fl_str_mv |
Datos mixtos Datos multidimensionales Proyecciones multidimensionales |
dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
description |
Los datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estudiado las consecuencias de diferentes medidas de similitud de tipo mixto en mapas visuales de datos multidimensionales. El estudio se centra en analizar el impacto de estas medidas combinándolas con técnicas de proyección multidimensionales conocidas, que con frecuencia son la opción al proporcionar un mecanismo visual para descubrir información en espacios multidimensionales. Se aplicó las métricas coeficiente de silueta, preservación del vecindad y coeficiente de estrés en las proyecciones de nueve conjuntos de datos para evaluar las diferentes medidas de distancia, tanto en términos de segregación como de preservación de la similitud. Además, se presenta un estudio de caso sobre datos urbanos que ilustra la necesidad de confiar en tales medidas. Sobre la base de los análisis, proporcionamos recomendaciones sobre la aplicación de medidas de similitud para conjuntos de datos multidimensionales de tipo mixto en tareas de análisis visual. |
publishDate |
2019 |
dc.date.accessioned.none.fl_str_mv |
2024-05-30T23:13:38Z |
dc.date.available.none.fl_str_mv |
2024-05-30T23:13:38Z |
dc.date.issued.fl_str_mv |
2019 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12390/1490 |
url |
https://hdl.handle.net/20.500.12390/1490 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
dc.publisher.none.fl_str_mv |
Universidad Católica San Pablo |
publisher.none.fl_str_mv |
Universidad Católica San Pablo |
dc.source.none.fl_str_mv |
reponame:CONCYTEC-Institucional instname:Consejo Nacional de Ciencia Tecnología e Innovación instacron:CONCYTEC |
instname_str |
Consejo Nacional de Ciencia Tecnología e Innovación |
instacron_str |
CONCYTEC |
institution |
CONCYTEC |
reponame_str |
CONCYTEC-Institucional |
collection |
CONCYTEC-Institucional |
repository.name.fl_str_mv |
Repositorio Institucional CONCYTEC |
repository.mail.fl_str_mv |
repositorio@concytec.gob.pe |
_version_ |
1844882994698911744 |
spelling |
Publicationrp04295600Muñoz Salas, Gina Lucia2024-05-30T23:13:38Z2024-05-30T23:13:38Z2019https://hdl.handle.net/20.500.12390/1490Los datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estudiado las consecuencias de diferentes medidas de similitud de tipo mixto en mapas visuales de datos multidimensionales. El estudio se centra en analizar el impacto de estas medidas combinándolas con técnicas de proyección multidimensionales conocidas, que con frecuencia son la opción al proporcionar un mecanismo visual para descubrir información en espacios multidimensionales. Se aplicó las métricas coeficiente de silueta, preservación del vecindad y coeficiente de estrés en las proyecciones de nueve conjuntos de datos para evaluar las diferentes medidas de distancia, tanto en términos de segregación como de preservación de la similitud. Además, se presenta un estudio de caso sobre datos urbanos que ilustra la necesidad de confiar en tales medidas. Sobre la base de los análisis, proporcionamos recomendaciones sobre la aplicación de medidas de similitud para conjuntos de datos multidimensionales de tipo mixto en tareas de análisis visual.Fondo Nacional de Desarrollo Científico y Tecnológico - FondecytspaUniversidad Católica San Pabloinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/SimilitudDatos mixtos-1Datos multidimensionales-1Proyecciones multidimensionales-1https://purl.org/pe-repo/ocde/ford#1.02.01-1Estudio de distancias para datos mixtos para análisis visual de datos multidimensionalesinfo:eu-repo/semantics/masterThesisreponame:CONCYTEC-Institucionalinstname:Consejo Nacional de Ciencia Tecnología e Innovacióninstacron:CONCYTEC#PLACEHOLDER_PARENT_METADATA_VALUE#Maestro en Ciencia de la ComputaciónCiencia de la ComputaciónUniversidad Católica San Pablo. Facultad de Ingeniería y Computación20.500.12390/1490oai:repositorio.concytec.gob.pe:20.500.12390/14902024-05-30 15:37:37.217https://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_14cbinfo:eu-repo/semantics/closedAccessmetadata only accesshttps://repositorio.concytec.gob.peRepositorio Institucional CONCYTECrepositorio@concytec.gob.pe#PLACEHOLDER_PARENT_METADATA_VALUE#<Publication xmlns="https://www.openaire.eu/cerif-profile/1.1/" id="8919b937-a99e-45a8-a3df-37a09f94fa55"> <Type xmlns="https://www.openaire.eu/cerif-profile/vocab/COAR_Publication_Types">http://purl.org/coar/resource_type/c_1843</Type> <Language>spa</Language> <Title>Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales</Title> <PublishedIn> <Publication> </Publication> </PublishedIn> <PublicationDate>2019</PublicationDate> <Authors> <Author> <DisplayName>Muñoz Salas, Gina Lucia</DisplayName> <Person id="rp04295" /> <Affiliation> <OrgUnit> </OrgUnit> </Affiliation> </Author> </Authors> <Editors> </Editors> <Publishers> <Publisher> <DisplayName>Universidad Católica San Pablo</DisplayName> <OrgUnit /> </Publisher> </Publishers> <License>https://creativecommons.org/licenses/by/4.0/</License> <Keyword>Similitud</Keyword> <Keyword>Datos mixtos</Keyword> <Keyword>Datos multidimensionales</Keyword> <Keyword>Proyecciones multidimensionales</Keyword> <Abstract>Los datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estudiado las consecuencias de diferentes medidas de similitud de tipo mixto en mapas visuales de datos multidimensionales. El estudio se centra en analizar el impacto de estas medidas combinándolas con técnicas de proyección multidimensionales conocidas, que con frecuencia son la opción al proporcionar un mecanismo visual para descubrir información en espacios multidimensionales. Se aplicó las métricas coeficiente de silueta, preservación del vecindad y coeficiente de estrés en las proyecciones de nueve conjuntos de datos para evaluar las diferentes medidas de distancia, tanto en términos de segregación como de preservación de la similitud. Además, se presenta un estudio de caso sobre datos urbanos que ilustra la necesidad de confiar en tales medidas. Sobre la base de los análisis, proporcionamos recomendaciones sobre la aplicación de medidas de similitud para conjuntos de datos multidimensionales de tipo mixto en tareas de análisis visual.</Abstract> <Access xmlns="http://purl.org/coar/access_right" > </Access> </Publication> -1 |
score |
13.08006 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).