Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
Descripción del Articulo
Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2021 |
Institución: | Universidad Nacional Mayor de San Marcos |
Repositorio: | UNMSM-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/18485 |
Enlace del recurso: | https://hdl.handle.net/20.500.12672/18485 |
Nivel de acceso: | acceso abierto |
Materia: | Procesamiento de lenguaje natural (Computación) Redes neuronales (Computación) Emociones https://purl.org/pe-repo/ocde/ford#1.02.01 |
Sumario: | Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).