Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones

Descripción del Articulo

la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocion...

Descripción completa

Detalles Bibliográficos
Autor: Delgado Mattos, Alessandra Daniela
Formato: tesis de maestría
Fecha de Publicación:2022
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/15077
Enlace del recurso:http://hdl.handle.net/20.500.12773/15077
Nivel de acceso:acceso abierto
Materia:Corpus orales
Emociones
Deep Learning
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocionalmente son un elemento clave en la implementación de sistemas automáticos de reconocimiento de emociones a partir de habla. La carencia de los mismos hace que los hablantes de un determinado idioma, acento o dialecto, no puedan usufructuar, en toda su amplitud, de los beneficios de este desarrollo tecnológico. [Objetivos] Esta tesis tiene como objetivo diseñar y construir un corpus de emociones en español con acento peruano, de modo que pueda ser utilizado en el entrenamiento y validación de sistemas basados en Deep Learning para el reconocimiento automático de emociones. [Método] Se comenzó realizando una revisión de la literatura sobre los modelos de clasificación de emociones y los esquemas relacionados al diseño y construcción de corpus orales de emociones. Después, se definieron los criterios para diseñar un método de construcción a partir de audio-vídeos existentes en la plataforma YouTube™. Finalmente, la calidad del corpus fue evaluada de manera cualitativa y cuantitativa. [Resultados] Se construyó un corpus etiquetado con tres atributos emocionales (valencia, excitación y dominancia), con un tamaño de 7 horas 45 minutos y 52 segundos, contiene voces de un total de 80 participantes (hombres y mujeres en edad adulta) desenvolviéndose en escenarios naturales tales como debates, entrevistas y reportajes. Asimismo, se encuentra disponible de forma abierta al público en el siguiente enlace: https://zenodo.org/record/5793223#.YczDf2jMLIV [Conclusión] El corpus oral de emociones fue evaluado cualitativamente en cuanto al alcance, naturalidad, contexto y descriptores, y cuantitativamente en cuanto a su eficacia real, cumpliendo las expectativas para lo que fue construido ya que permitió el entrenamiento y validación en sistemas de reconocimiento de emociones en idioma español con acento peruano, obteniendo un buen desempeño, del 0.84 y 0.73 para las etapas de entrenamiento y validación respectivamente.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).