Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
Descripción del Articulo
El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textua...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2025 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/33082 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/33082 |
| Nivel de acceso: | acceso abierto |
| Materia: | Análisis de sentimientos Teoría de grafos Procesamiento de lenguaje natural (Computación) Aprendizaje automático (Inteligencia artificial) https://purl.org/pe-repo/ocde/ford#2.00.00 |
| Sumario: | El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textual. En los últimos años, la investigación basada en el conocimiento de grafos ha surgido como un enfoque innovador y prometedor de la Inteligencia Artificial (IA) para obtener una mejor representación estructurada de los datos. El presente trabajo propone una metodología no supervisada basada en el conocimiento de grafos, específicamente en la vectorización de nodos que representan palabras de las oraciones con sus respectivas relaciones conceptuales. Parte de esta metodología se construyen diccionarios de palabras clasificadas por polaridades (positiva, negativa y neutral) utilizando VADER (Valence Aware Dictionary and sEntiment Reasoner), junto a conceptos basado en grafos conceptuales de WordNet y ConceptNet. Esta metodología permite capturar las relaciones de co-ocurrencia y relaciones conceptuales, junto con la polaridad de palabras. Así mismo, se propone un algoritmo denominado Polarity-biased random Walk para construir caminos del grafo utilizando un bias de polaridad. Luego mediante el algoritmo Skip-Gram se realiza la vectorización de palabras que contiene los caminos obtenidas del grafo. Esta metodología permitió encontrar resultados como, que a mayor profundidad de caminos y número de caminos por nodo mediante un bias de 0.95 con ConceptNet o WordNet llegan a ser mejor el resultado de clasificación de polaridad de sentimientos en comparación a modelos como Node2vec, GraphSAGA, Graph Attention y Graph Convolution Networks. Así mismo, embeddings construido a partir de IMDB movie permite mejorar los resultados de precisión para aplicar en dominios espec´ıficos en comparación a modelos como Word2Vec, FastText, Glove y Bert, este último con resultados muy cercanos a las propuestas. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).