Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio

Descripción del Articulo

Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles...

Descripción completa

Detalles Bibliográficos
Autor: Mauricio Salazar, Josue Angel
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/18485
Enlace del recurso:https://hdl.handle.net/20.500.12672/18485
Nivel de acceso:acceso abierto
Materia:Procesamiento de lenguaje natural (Computación)
Redes neuronales (Computación)
Emociones
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).