Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud

Descripción del Articulo

En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se uti...

Descripción completa

Detalles Bibliográficos
Autor: Rodríguez Urquiaga, Roberto Josué
Formato: tesis de maestría
Fecha de Publicación:2018
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:UNSA/7148
Enlace del recurso:http://repositorio.unsa.edu.pe/handle/UNSA/7148
Nivel de acceso:acceso abierto
Materia:Visualización temporal de temas
Visualización de la evolución
Temática
Modelos de temas probabilisticos
CITATION-LDA
Neighbor joining tree
https://purl.org/pe-repo/ocde/ford#2.02.04
id UNSA_f70c303f09e3e9aefccef0923f2e5b88
oai_identifier_str oai:repositorio.unsa.edu.pe:UNSA/7148
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
spelling Cuadros Valdivia, Ana MariaRodríguez Urquiaga, Roberto Josué2018-12-12T14:02:15Z2018-12-12T14:02:15Z2018En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se utilizó trabajos previos como CITATION-Latent Dirichlet Allocation (CITATION-LDA) que posee la ventaja de conservar la información antes mencionada, haciendo uso de las citas bibliográficas como vector característico para la extracción del tema. Mediante probabilidad es posible obtener una fecha aproximada del tópico analizado, esto gracias a que cada elemento del vector característico es un documento que posee una fecha de publicación. Esto se uso para construir el mapa visual a través del algoritmo Neighbor joining tree antes usado para la construcción de árboles filogenéticos y Radial layout un me´todo para presentar los resultados de una forma visualmente organizada en el cual se pueda apreciar las relaciones de similitud. También se agregó a la visualización interactividad para facilitar el trabajo de análisis de usuario. Los resultados muestran la evolución de temas organizados por similitud de contenido y temporal además de la interacción temática, comparación de similaridades entre tópicos e información entre de metadatos es superior a métodos anteriormente propuestos.Tesisapplication/pdfhttp://repositorio.unsa.edu.pe/handle/UNSA/7148spaUniversidad Nacional de San Agustín de Arequipainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAVisualización temporal de temasVisualización de la evoluciónTemáticaModelos de temas probabilisticosCITATION-LDANeighbor joining treehttps://purl.org/pe-repo/ocde/ford#2.02.04Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitudinfo:eu-repo/semantics/masterThesisSUNEDUMaestría en Ciencias: Informática con mención en Tecnologíaas de InformaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosMaestríaMaestro en Ciencias: Informática con mención en Tecnologíaas de InformaciónTEXTISMrourrj.pdf.txtISMrourrj.pdf.txtExtracted texttext/plain109397https://repositorio.unsa.edu.pe/bitstreams/c3e16baa-b5d7-4905-804f-8b21b4564534/downloadb27d8d18358a9656ed60f98c47fe1b8bMD52ORIGINALISMrourrj.pdfISMrourrj.pdfapplication/pdf4586743https://repositorio.unsa.edu.pe/bitstreams/1053af63-b84a-4f3f-9c4b-fe6913fb51e3/downloadc65c55d0b42904c21d32b1c5e428ba43MD53UNSA/7148oai:repositorio.unsa.edu.pe:UNSA/71482022-05-29 11:32:52.289http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe
dc.title.es_PE.fl_str_mv Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
title Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
spellingShingle Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
Rodríguez Urquiaga, Roberto Josué
Visualización temporal de temas
Visualización de la evolución
Temática
Modelos de temas probabilisticos
CITATION-LDA
Neighbor joining tree
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
title_full Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
title_fullStr Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
title_full_unstemmed Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
title_sort Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud
author Rodríguez Urquiaga, Roberto Josué
author_facet Rodríguez Urquiaga, Roberto Josué
author_role author
dc.contributor.advisor.fl_str_mv Cuadros Valdivia, Ana Maria
dc.contributor.author.fl_str_mv Rodríguez Urquiaga, Roberto Josué
dc.subject.es_PE.fl_str_mv Visualización temporal de temas
Visualización de la evolución
Temática
Modelos de temas probabilisticos
CITATION-LDA
Neighbor joining tree
topic Visualización temporal de temas
Visualización de la evolución
Temática
Modelos de temas probabilisticos
CITATION-LDA
Neighbor joining tree
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se utilizó trabajos previos como CITATION-Latent Dirichlet Allocation (CITATION-LDA) que posee la ventaja de conservar la información antes mencionada, haciendo uso de las citas bibliográficas como vector característico para la extracción del tema. Mediante probabilidad es posible obtener una fecha aproximada del tópico analizado, esto gracias a que cada elemento del vector característico es un documento que posee una fecha de publicación. Esto se uso para construir el mapa visual a través del algoritmo Neighbor joining tree antes usado para la construcción de árboles filogenéticos y Radial layout un me´todo para presentar los resultados de una forma visualmente organizada en el cual se pueda apreciar las relaciones de similitud. También se agregó a la visualización interactividad para facilitar el trabajo de análisis de usuario. Los resultados muestran la evolución de temas organizados por similitud de contenido y temporal además de la interacción temática, comparación de similaridades entre tópicos e información entre de metadatos es superior a métodos anteriormente propuestos.
publishDate 2018
dc.date.accessioned.none.fl_str_mv 2018-12-12T14:02:15Z
dc.date.available.none.fl_str_mv 2018-12-12T14:02:15Z
dc.date.issued.fl_str_mv 2018
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unsa.edu.pe/handle/UNSA/7148
url http://repositorio.unsa.edu.pe/handle/UNSA/7148
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/c3e16baa-b5d7-4905-804f-8b21b4564534/download
https://repositorio.unsa.edu.pe/bitstreams/1053af63-b84a-4f3f-9c4b-fe6913fb51e3/download
bitstream.checksum.fl_str_mv b27d8d18358a9656ed60f98c47fe1b8b
c65c55d0b42904c21d32b1c5e428ba43
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828762839919099904
score 13.949927
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).