Análisis de los métodos de recolección de textos sarcásticos

Descripción del Articulo

La detección de sarcasmo es un obstáculo particularmente complicado de resolver dentro del Procesamiento de Lenguaje Natural. En los últimos años se han propuesto mejoras en la arquitectura y funcionamiento de los modelos que buscan resolver el problema. No obstante, se ha dejado del lado la importa...

Descripción completa

Detalles Bibliográficos
Autor: Velásquez Gushiken, Andrea
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad de Ingeniería y tecnología
Repositorio:UTEC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utec.edu.pe:20.500.12815/307
Enlace del recurso:https://hdl.handle.net/20.500.12815/307
Nivel de acceso:acceso abierto
Materia:Análisis de Sentimientos
Detección de sarcasmo
Procesamiento de Lenguaje Natural
Extracción de datos
Sarcasmo
Natural Language Processing
Sentiment Analysis
Sarcasm Detection
DATA extraction
Sarcasm
https://purl.org/pe-repo/ocde/ford#1.02.02
Descripción
Sumario:La detección de sarcasmo es un obstáculo particularmente complicado de resolver dentro del Procesamiento de Lenguaje Natural. En los últimos años se han propuesto mejoras en la arquitectura y funcionamiento de los modelos que buscan resolver el problema. No obstante, se ha dejado del lado la importancia de los textos sarcásticos que se utilizan para entrenarlos y, con ella, los métodos de recolección de estos textos. Los métodos tradicionales producen datasets sesgados, con errores y ruidosos, y no distinguen entre los dos tipos de sarcasmo: intencional y percibido. Por ello, en la presente investigación, se analiza cuantitativamente el impacto que tienen los métodos de recolección de datasets sarcásticos en inglés en los modelos de detección de sarcasmo. Con este fin, se hace uso de datasets públicos y se generan dos nuevos datasets con el método de Supervisión Reactiva (Shmueli et al., 2020) para analizar el impacto de los distintos métodos de recolección en el desempeño de modelos de detección de sarcasmo. Se realiza una comparación detallada de los métodos, entrenando modelos en el estado del arte con un dataset representativo de cada uno de ellos. Los resultados sugieren que es posible obtener mejores resultados en los modelos de detección de sarcasmo utilizando un método que provea un dataset limpio y el mismo tipo de sarcasmo que el que se quiere detectar. A su vez, confirman los descubrimientos realizados en investigaciones anteriores, y abren el camino a trabajos futuros.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).