Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos

Descripción del Articulo

El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textua...

Descripción completa

Detalles Bibliográficos
Autor: Mamani Coaquira, Yonatan
Formato: tesis doctoral
Fecha de Publicación:2025
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/33082
Enlace del recurso:http://hdl.handle.net/20.500.12404/33082
Nivel de acceso:acceso abierto
Materia:Análisis de sentimientos
Teoría de grafos
Procesamiento de lenguaje natural (Computación)
Aprendizaje automático (Inteligencia artificial)
https://purl.org/pe-repo/ocde/ford#2.00.00
id PUCP_e6a15cf8d8b93240a238f769ee3ed566
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/33082
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.none.fl_str_mv Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
title Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
spellingShingle Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
Mamani Coaquira, Yonatan
Análisis de sentimientos
Teoría de grafos
Procesamiento de lenguaje natural (Computación)
Aprendizaje automático (Inteligencia artificial)
https://purl.org/pe-repo/ocde/ford#2.00.00
title_short Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
title_full Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
title_fullStr Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
title_full_unstemmed Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
title_sort Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
author Mamani Coaquira, Yonatan
author_facet Mamani Coaquira, Yonatan
author_role author
dc.contributor.advisor.fl_str_mv Villanueva Talavera, Edwin Rafael
dc.contributor.author.fl_str_mv Mamani Coaquira, Yonatan
dc.subject.none.fl_str_mv Análisis de sentimientos
Teoría de grafos
Procesamiento de lenguaje natural (Computación)
Aprendizaje automático (Inteligencia artificial)
topic Análisis de sentimientos
Teoría de grafos
Procesamiento de lenguaje natural (Computación)
Aprendizaje automático (Inteligencia artificial)
https://purl.org/pe-repo/ocde/ford#2.00.00
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.00.00
description El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textual. En los últimos años, la investigación basada en el conocimiento de grafos ha surgido como un enfoque innovador y prometedor de la Inteligencia Artificial (IA) para obtener una mejor representación estructurada de los datos. El presente trabajo propone una metodología no supervisada basada en el conocimiento de grafos, específicamente en la vectorización de nodos que representan palabras de las oraciones con sus respectivas relaciones conceptuales. Parte de esta metodología se construyen diccionarios de palabras clasificadas por polaridades (positiva, negativa y neutral) utilizando VADER (Valence Aware Dictionary and sEntiment Reasoner), junto a conceptos basado en grafos conceptuales de WordNet y ConceptNet. Esta metodología permite capturar las relaciones de co-ocurrencia y relaciones conceptuales, junto con la polaridad de palabras. Así mismo, se propone un algoritmo denominado Polarity-biased random Walk para construir caminos del grafo utilizando un bias de polaridad. Luego mediante el algoritmo Skip-Gram se realiza la vectorización de palabras que contiene los caminos obtenidas del grafo. Esta metodología permitió encontrar resultados como, que a mayor profundidad de caminos y número de caminos por nodo mediante un bias de 0.95 con ConceptNet o WordNet llegan a ser mejor el resultado de clasificación de polaridad de sentimientos en comparación a modelos como Node2vec, GraphSAGA, Graph Attention y Graph Convolution Networks. Así mismo, embeddings construido a partir de IMDB movie permite mejorar los resultados de precisión para aplicar en dominios espec´ıficos en comparación a modelos como Word2Vec, FastText, Glove y Bert, este último con resultados muy cercanos a las propuestas.
publishDate 2025
dc.date.created.none.fl_str_mv 2025
dc.date.accessioned.none.fl_str_mv 2026-02-02T17:45:03Z
dc.date.available.none.fl_str_mv 2026-02-02T17:45:03Z
dc.date.issued.fl_str_mv 2026-02-02
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/33082
url http://hdl.handle.net/20.500.12404/33082
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/ad53ccd4-101a-40be-bbc0-05b0a0ce1821/download
https://tesis.pucp.edu.pe/bitstreams/a760202f-887f-4b2d-bedc-8648472bc070/download
https://tesis.pucp.edu.pe/bitstreams/5c1315f3-7852-4739-9242-6d96de0fd4f0/download
https://tesis.pucp.edu.pe/bitstreams/10a1684b-4848-498a-bfb4-6127d2dd2459/download
https://tesis.pucp.edu.pe/bitstreams/7d81677b-528b-44a1-9434-6be3ec4b827d/download
https://tesis.pucp.edu.pe/bitstreams/6cf4277c-4696-45dc-9c16-f0adb4770126/download
https://tesis.pucp.edu.pe/bitstreams/1b8778f7-23f8-4ba5-97b0-63683f4d38c7/download
https://tesis.pucp.edu.pe/bitstreams/dcbc1860-d0c8-4dd6-97b3-ef25b66233f3/download
bitstream.checksum.fl_str_mv a6012205a41ab731ae14b7762f77d60e
d8e1c84d8b5edc12f2ed61b178b87cac
3cce22cdbfa6875906fb15a718e73ab5
bb9bdc0b3349e4284e09149f943790b4
54693d9f88e4bf50c0d21b001b78393b
4f31a8822bef94db1c8e41015b609f99
eabcc296667da8e06f6d0f64a7b7fec9
bb51e2c7a96dec20842acd0415aa8a27
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1856933037321748480
spelling Villanueva Talavera, Edwin RafaelMamani Coaquira, Yonatan2026-02-02T17:45:03Z2026-02-02T17:45:03Z20252026-02-02http://hdl.handle.net/20.500.12404/33082El análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textual. En los últimos años, la investigación basada en el conocimiento de grafos ha surgido como un enfoque innovador y prometedor de la Inteligencia Artificial (IA) para obtener una mejor representación estructurada de los datos. El presente trabajo propone una metodología no supervisada basada en el conocimiento de grafos, específicamente en la vectorización de nodos que representan palabras de las oraciones con sus respectivas relaciones conceptuales. Parte de esta metodología se construyen diccionarios de palabras clasificadas por polaridades (positiva, negativa y neutral) utilizando VADER (Valence Aware Dictionary and sEntiment Reasoner), junto a conceptos basado en grafos conceptuales de WordNet y ConceptNet. Esta metodología permite capturar las relaciones de co-ocurrencia y relaciones conceptuales, junto con la polaridad de palabras. Así mismo, se propone un algoritmo denominado Polarity-biased random Walk para construir caminos del grafo utilizando un bias de polaridad. Luego mediante el algoritmo Skip-Gram se realiza la vectorización de palabras que contiene los caminos obtenidas del grafo. Esta metodología permitió encontrar resultados como, que a mayor profundidad de caminos y número de caminos por nodo mediante un bias de 0.95 con ConceptNet o WordNet llegan a ser mejor el resultado de clasificación de polaridad de sentimientos en comparación a modelos como Node2vec, GraphSAGA, Graph Attention y Graph Convolution Networks. Así mismo, embeddings construido a partir de IMDB movie permite mejorar los resultados de precisión para aplicar en dominios espec´ıficos en comparación a modelos como Word2Vec, FastText, Glove y Bert, este último con resultados muy cercanos a las propuestas.Sentiment analysis has found applications in various fields such as psychology, philosophy, sociology, marketing, economics, education, etc. In this sense, social media has become a tool for people to express their opinions, especially in written form. In recent years, research based on graph knowledge has emerged as an innovative and promising approach of Artificial Intelligence (AI) to achieve a better structured representation of data. This work proposes an unsupervised methodology based on graph knowledge, specifically in the vectorization of nodes representing words in sentences along with their respective conceptual relationships. Part of this methodology involves building dictionaries of words classified by polarity (positive, negative, and neutral) using VADER (Valence Aware Dictionary and sEntiment Reasoner), along with concepts based on conceptual graphs from WordNet and ConceptNet. This methodology captures co-occurrence relationships and conceptual relationships, along with the polarity of words. An algorithm called Polarity-biased random Walk is also proposed to construct graph paths using a polarity bias. Then, using the Skip-Gram algorithm, the vectorization of words containing the paths obtained from the graph is performed. This methodology allowed for findings such that, with greater path depth and number of paths per node using a bias of 0.95 with ConceptNet or WordNet, the results for sentiment polarity classification improved compared to models like Node2vec, GraphSAGE, Graph Attention, and Graph Convolution Networks. Additionally, embeddings constructed from the IMDB movie dataset improve accuracy results for application in specific domains compared to models like Word2Vec, FastText, Glove, and Bert, with the latter showing results very close to the proposed methods.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Análisis de sentimientosTeoría de grafosProcesamiento de lenguaje natural (Computación)Aprendizaje automático (Inteligencia artificial)https://purl.org/pe-repo/ocde/ford#2.00.00Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientosinfo:eu-repo/semantics/doctoralThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUDoctor en IngenieríaDoctoradoPontificia Universidad Católica del Perú. Escuela de PosgradoIngeniería29714308https://orcid.org/0000-0002-6540-123046707738732028Iglesias Fernández, Carlos ÁVillanueva Talavera, Edwin RafaelSipiran Mendoza, Ivan AnselmoIrvin Franco Benito, Dongo EscalanteBeltran Castañon, Cesar Armandohttps://purl.org/pe-repo/renati/level#doctorhttps://purl.org/pe-repo/renati/type#tesisORIGINALMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdfMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdfTexto completoapplication/pdf1290382https://tesis.pucp.edu.pe/bitstreams/ad53ccd4-101a-40be-bbc0-05b0a0ce1821/downloada6012205a41ab731ae14b7762f77d60eMD51trueAnonymousREADMAMANI_COAQUIRA_YONATAN_T.pdfMAMANI_COAQUIRA_YONATAN_T.pdfReporte de originalidadapplication/pdf20525675https://tesis.pucp.edu.pe/bitstreams/a760202f-887f-4b2d-bedc-8648472bc070/downloadd8e1c84d8b5edc12f2ed61b178b87cacMD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81166https://tesis.pucp.edu.pe/bitstreams/5c1315f3-7852-4739-9242-6d96de0fd4f0/download3cce22cdbfa6875906fb15a718e73ab5MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/10a1684b-4848-498a-bfb4-6127d2dd2459/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdf.txtMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdf.txtExtracted texttext/plain268834https://tesis.pucp.edu.pe/bitstreams/7d81677b-528b-44a1-9434-6be3ec4b827d/download54693d9f88e4bf50c0d21b001b78393bMD55falseAnonymousREADMAMANI_COAQUIRA_YONATAN_T.pdf.txtMAMANI_COAQUIRA_YONATAN_T.pdf.txtExtracted texttext/plain9052https://tesis.pucp.edu.pe/bitstreams/6cf4277c-4696-45dc-9c16-f0adb4770126/download4f31a8822bef94db1c8e41015b609f99MD57falseAdministratorREADTHUMBNAILMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdf.jpgMAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdf.jpgGenerated Thumbnailimage/jpeg12177https://tesis.pucp.edu.pe/bitstreams/1b8778f7-23f8-4ba5-97b0-63683f4d38c7/downloadeabcc296667da8e06f6d0f64a7b7fec9MD56falseAnonymousREADMAMANI_COAQUIRA_YONATAN_T.pdf.jpgMAMANI_COAQUIRA_YONATAN_T.pdf.jpgGenerated Thumbnailimage/jpeg7855https://tesis.pucp.edu.pe/bitstreams/dcbc1860-d0c8-4dd6-97b3-ef25b66233f3/downloadbb51e2c7a96dec20842acd0415aa8a27MD58falseAdministratorREAD20.500.12404/33082oai:tesis.pucp.edu.pe:20.500.12404/330822026-02-03 08:37:10.88http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.966121
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).