Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones
Descripción del Articulo
la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocion...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2022 |
Institución: | Universidad Nacional de San Agustín |
Repositorio: | UNSA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/15077 |
Enlace del recurso: | http://hdl.handle.net/20.500.12773/15077 |
Nivel de acceso: | acceso abierto |
Materia: | Corpus orales Emociones Deep Learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
Sumario: | la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocionalmente son un elemento clave en la implementación de sistemas automáticos de reconocimiento de emociones a partir de habla. La carencia de los mismos hace que los hablantes de un determinado idioma, acento o dialecto, no puedan usufructuar, en toda su amplitud, de los beneficios de este desarrollo tecnológico. [Objetivos] Esta tesis tiene como objetivo diseñar y construir un corpus de emociones en español con acento peruano, de modo que pueda ser utilizado en el entrenamiento y validación de sistemas basados en Deep Learning para el reconocimiento automático de emociones. [Método] Se comenzó realizando una revisión de la literatura sobre los modelos de clasificación de emociones y los esquemas relacionados al diseño y construcción de corpus orales de emociones. Después, se definieron los criterios para diseñar un método de construcción a partir de audio-vídeos existentes en la plataforma YouTube™. Finalmente, la calidad del corpus fue evaluada de manera cualitativa y cuantitativa. [Resultados] Se construyó un corpus etiquetado con tres atributos emocionales (valencia, excitación y dominancia), con un tamaño de 7 horas 45 minutos y 52 segundos, contiene voces de un total de 80 participantes (hombres y mujeres en edad adulta) desenvolviéndose en escenarios naturales tales como debates, entrevistas y reportajes. Asimismo, se encuentra disponible de forma abierta al público en el siguiente enlace: https://zenodo.org/record/5793223#.YczDf2jMLIV [Conclusión] El corpus oral de emociones fue evaluado cualitativamente en cuanto al alcance, naturalidad, contexto y descriptores, y cuantitativamente en cuanto a su eficacia real, cumpliendo las expectativas para lo que fue construido ya que permitió el entrenamiento y validación en sistemas de reconocimiento de emociones en idioma español con acento peruano, obteniendo un buen desempeño, del 0.84 y 0.73 para las etapas de entrenamiento y validación respectivamente. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).