Creación de un corpus de habla del Quechua Collao para el reconocimiento automático de emociones dimensionales

Descripción del Articulo

El reconocimiento automático de emociones del habla es un área de investigación importante para la interacción humano-computadora y la computación afectiva. Más de diez millones de personas hablan el idioma quechua en toda América del Sur, y una de las variantes más conocidas es el Quechua-Collao. S...

Descripción completa

Detalles Bibliográficos
Autores: Paccotacya Yanque, Rosa Yuliana Gabriela, Huanca Anquise, Candy Alexandra
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/16383
Enlace del recurso:https://hdl.handle.net/20.500.12773/16383
Nivel de acceso:acceso abierto
Materia:Reconocimiento automático de emociones
Aprendizaje de máquina
Creación de corpus
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:El reconocimiento automático de emociones del habla es un área de investigación importante para la interacción humano-computadora y la computación afectiva. Más de diez millones de personas hablan el idioma quechua en toda América del Sur, y una de las variantes más conocidas es el Quechua-Collao. Sin embargo, no existe un corpus adecuado para el reconocimiento automático de emociones, lo que genera una barrera para los quechuahablantes que quieran utilizar esta tecnología. Por lo tanto, el aporte de este trabajo es la creación de un corpus de habla en quechua, utilizando la variante Collao, que se pone a disposición de la comunidad investigadora públicamente. El corpus se creó a partir de un script de 2070 palabras y oraciones recopiladas para esta tarea, divididas en nueve emociones categóricas. Siete personas hablantes nativas de quechua fueron grabadas leyendo el script. La anotación fue realizada por 4 personas en una escala discreta de 1 a 5 según 3 dimensiones: valencia, excitación (o activación) y dominancia. La duración total del corpus es de 15 horas, 15 minutos y 15 segundos. Para demostrar la utilidad del corpus, se realizó el reconocimiento de emociones del habla utilizando métodos de aprendizaje automático y redes neuronales.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).