Eficiencia de un modelo predictivo basado en análisis de sentimientos en los resultados de las elecciones presidenciales del Perú en el año 2021
Descripción del Articulo
En el Perú, algunas de las empresas encuestadoras más populares han perdido credibilidad por parte de la población, debido a sus constantes fallas de predicción y tener pasados relacionados con la corrupción principalmente en relación a contiendas electorales. Debido a esto, muchas personas creen qu...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Nacional José María Arguedas |
| Repositorio: | UNAJMA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unajma.edu.pe:20.500.14168/788 |
| Enlace del recurso: | https://hdl.handle.net/20.500.14168/788 |
| Nivel de acceso: | acceso abierto |
| Materia: | Análisis de Sentimientos; Encuesta electoral; Modelo predictivo; Resultados electorales. http://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | En el Perú, algunas de las empresas encuestadoras más populares han perdido credibilidad por parte de la población, debido a sus constantes fallas de predicción y tener pasados relacionados con la corrupción principalmente en relación a contiendas electorales. Debido a esto, muchas personas creen que los sondeos electorales son realizados sin la debida objetividad. Esta situación ha llevado buscar nuevas maneras de obtener predicciones, por lo que el objetivo de este trabajo fue evaluar la eficiencia de un modelo predictivo basado en Análisis de Sentimientos en los resultados de las elecciones presidenciales del Perú en el año 2021. La investigación fue de tipo aplicada, retrospectiva y con un enfoque cuantitativo, de nivel predictivo y un diseño preexperimental. El enfoque planteado utiliza el conjunto de datos TASS2016 para realizar el entrenamiento del modelo, y para el procesamiento se usó tweets referentes a las elecciones presidenciales, el cual, contó con una población de 81214 y 15007 tweets para la primera y segunda vuelta electoral y una muestra de 5207 y 1495 tweets respectivamente. Los tweets son clasificados de acuerdo a su polaridad, siendo considerados solamente aquellos que sean positivos y que dentro de su contenido exista una referencia hacia un candidato político. Para la evaluación de modelo planteado se utilizó las medidas de error MAE y RSME. Finalmente, se logró obtener un error MAE de 6.152% muy cercano al resultado de las encuestadoras para la primera vuelta, y para la segunda vuelta un error MAE de 2.574% siendo un resultado considerable al haber acertado en la predicción del ganador de la contienda electoral. El modelo desarrollado es una alternativa de predicción de resultados electorales simplemente algorítmica y de bajo costo. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).