Intención de voto a través de un modelo de análisis de sentimientos en twitter basado en técnicas de Machine Learning

Descripción del Articulo

El uso de técnicas de análisis de sentimientos para capturar las opiniones de las masas a través de las redes sociales ha aumentado en los últimos años en diferentes áreas como la política, así lo demuestran estudios realizados alrededor del mundo, donde los niveles de asertividad alcanzados en la p...

Descripción completa

Detalles Bibliográficos
Autor: Flores Arnao, Alodia
Formato: tesis de maestría
Fecha de Publicación:2023
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/21160
Enlace del recurso:https://repositorio.unap.edu.pe/handle/20.500.14082/21160
Nivel de acceso:acceso abierto
Materia:Análisis de sentimientos
Aprendizaje automático
Intención de voto
Redes sociales
Tuit
Twitter
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El uso de técnicas de análisis de sentimientos para capturar las opiniones de las masas a través de las redes sociales ha aumentado en los últimos años en diferentes áreas como la política, así lo demuestran estudios realizados alrededor del mundo, donde los niveles de asertividad alcanzados en la predicción de intención de voto fueron significativos. Considerando el contexto latinoamericano, como las Elecciones Presidenciales Perú 2021, el estudio se propuso determinar la técnica de Machine Learning más asertiva para la predicción de intención de voto aplicada a un modelo de análisis de sentimientos en Twitter. Para ello, se construyó un conjunto de datos denominado Elecciones Bicentenario 2021 Tweets, conformado por 49,916 tweets históricos publicados en idioma español, cuyas características fueron extraídas usando TF-IDF, BOW y N-Gramas, por el impacto que tienen en el desempeño del análisis de sentimientos. Luego, se aplicaron algoritmos de clasificación como Regresión Logística, Naïve Bayes, Máquinas de Vectores de Soporte, y Árboles de Decisión al modelo propuesto, los cuales fueron evaluados de manera cuantitativa, en términos de exactitud, precisión, exhaustividad y valor-F1. Los resultados electorales y los obtenidos por el modelo coinciden con el sentimiento expresado en las redes sociales en la mayoría de los casos, observándose que Regresión Logística tiene mejor desempeño, alcanzado un 79% de exactitud y precisión, 73% de exhaustividad y 76% de valor-F1. En conclusión, el algoritmo más asertivo para la predicción de intención de voto fue Regresión Logística, seguido por Máquinas de Vectores de Soporte, Naïve Bayes y Árboles de Decisión.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).