Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos

Descripción del Articulo

El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textua...

Descripción completa

Detalles Bibliográficos
Autor: Mamani Coaquira, Yonatan
Formato: tesis doctoral
Fecha de Publicación:2025
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/33082
Enlace del recurso:http://hdl.handle.net/20.500.12404/33082
Nivel de acceso:acceso abierto
Materia:Análisis de sentimientos
Teoría de grafos
Procesamiento de lenguaje natural (Computación)
Aprendizaje automático (Inteligencia artificial)
https://purl.org/pe-repo/ocde/ford#2.00.00
Descripción
Sumario:El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textual. En los últimos años, la investigación basada en el conocimiento de grafos ha surgido como un enfoque innovador y prometedor de la Inteligencia Artificial (IA) para obtener una mejor representación estructurada de los datos. El presente trabajo propone una metodología no supervisada basada en el conocimiento de grafos, específicamente en la vectorización de nodos que representan palabras de las oraciones con sus respectivas relaciones conceptuales. Parte de esta metodología se construyen diccionarios de palabras clasificadas por polaridades (positiva, negativa y neutral) utilizando VADER (Valence Aware Dictionary and sEntiment Reasoner), junto a conceptos basado en grafos conceptuales de WordNet y ConceptNet. Esta metodología permite capturar las relaciones de co-ocurrencia y relaciones conceptuales, junto con la polaridad de palabras. Así mismo, se propone un algoritmo denominado Polarity-biased random Walk para construir caminos del grafo utilizando un bias de polaridad. Luego mediante el algoritmo Skip-Gram se realiza la vectorización de palabras que contiene los caminos obtenidas del grafo. Esta metodología permitió encontrar resultados como, que a mayor profundidad de caminos y número de caminos por nodo mediante un bias de 0.95 con ConceptNet o WordNet llegan a ser mejor el resultado de clasificación de polaridad de sentimientos en comparación a modelos como Node2vec, GraphSAGA, Graph Attention y Graph Convolution Networks. Así mismo, embeddings construido a partir de IMDB movie permite mejorar los resultados de precisión para aplicar en dominios espec´ıficos en comparación a modelos como Word2Vec, FastText, Glove y Bert, este último con resultados muy cercanos a las propuestas.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).