Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN

Descripción del Articulo

El área de reconocimiento automática de voz(ASR) se define como la transformación de señales acústicas en palabras de cadena. Esta área se ha desarrollado durante muchos años para facilitar la vida de las personas, por lo que se implementó en varios idiomas. Sin embargo, el desarrollo de ASR en algu...

Descripción completa

Detalles Bibliográficos
Autor: Chacca Chuctaya, Hernan Faustino
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:UNSA/9904
Enlace del recurso:http://repositorio.unsa.edu.pe/handle/UNSA/9904
Nivel de acceso:acceso abierto
Materia:Reconocimiento automático de voz
MFCC
DTW
KNN
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El área de reconocimiento automática de voz(ASR) se define como la transformación de señales acústicas en palabras de cadena. Esta área se ha desarrollado durante muchos años para facilitar la vida de las personas, por lo que se implementó en varios idiomas. Sin embargo, el desarrollo de ASR en algunos idiomas con pocos recursos de base de datos pero con una gran población que habla estos idiomas es muy bajo. El desarrollo de ASR en el idioma quechua es casi nulo, lo que lleva a la cultura y la población a aislarse de la tecnología y la información. En este trabajo se desarrolla un sistema ASR de números Quechua aislados donde se implementan los métodos de Mel-Frequency Cepstral Coefficients (MFCC), Dynamic Time Warping (DTW) y K-Nearest Neighbor (KNN) utilizando una base de datos compuesta por audios de números grabados en quechua desde uno hasta diez. Los audios grabados para alimentar la base de datos fueron grabados por hablantes nativos de quechua entre hombres y mujeres. La precisión de reconocimiento alcanzada en este trabajo de investigación fue de 91.1%.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).