Análisis visual de la evolución de temas en Corpus de documentos usando árboles de Similitud

Descripción del Articulo

En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se uti...

Descripción completa

Detalles Bibliográficos
Autor: Rodríguez Urquiaga, Roberto Josué
Formato: tesis de maestría
Fecha de Publicación:2018
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:UNSA/7148
Enlace del recurso:http://repositorio.unsa.edu.pe/handle/UNSA/7148
Nivel de acceso:acceso abierto
Materia:Visualización temporal de temas
Visualización de la evolución
Temática
Modelos de temas probabilisticos
CITATION-LDA
Neighbor joining tree
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:En este trabajo se propone visualizar la evolución temática de corpus de documentos usando Neighbor joining tree (NJT). Para poder lograr esto es necesario extraer vectores característicos que conserven una fecha probabilista aproximada, además conservar su informacián temática. Para este fin se utilizó trabajos previos como CITATION-Latent Dirichlet Allocation (CITATION-LDA) que posee la ventaja de conservar la información antes mencionada, haciendo uso de las citas bibliográficas como vector característico para la extracción del tema. Mediante probabilidad es posible obtener una fecha aproximada del tópico analizado, esto gracias a que cada elemento del vector característico es un documento que posee una fecha de publicación. Esto se uso para construir el mapa visual a través del algoritmo Neighbor joining tree antes usado para la construcción de árboles filogenéticos y Radial layout un me´todo para presentar los resultados de una forma visualmente organizada en el cual se pueda apreciar las relaciones de similitud. También se agregó a la visualización interactividad para facilitar el trabajo de análisis de usuario. Los resultados muestran la evolución de temas organizados por similitud de contenido y temporal además de la interacción temática, comparación de similaridades entre tópicos e información entre de metadatos es superior a métodos anteriormente propuestos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).