Mejora del sistema de control de una calculadora estándar usando la plataforma PXI y el algoritmo de Coeficientes Cepstrales en Escala Mel

Descripción del Articulo

Plantea la realización de cambios necesarios al sistema de reconocimiento de voz que controla a la calculadora estándar VOXAG. Este sistema utiliza el algoritmo de Coeficientes Cepstrales en Escala Mel (MFCC) y la plataforma PXI para implementar el procesamiento. Con base en la aplicación previament...

Descripción completa

Detalles Bibliográficos
Autor: Guzmán Rosario, Gabriel Alfonso
Formato: tesis de grado
Fecha de Publicación:2012
Institución:Superintendencia Nacional de Educación Superior Universitaria
Repositorio:Registro Nacional de Trabajos conducentes a Grados y Títulos - RENATI
Lenguaje:español
OAI Identifier:oai:renati.sunedu.gob.pe:renati/1982
Enlace del recurso:http://renati.sunedu.gob.pe/handle/sunedu/1584402
Nivel de acceso:acceso abierto
Materia:Análisis cepstral
Reconocimiento de voz
Sistemas de reconocimiento de voz
http://purl.org/pe-repo/ocde/ford#2.00.00
http://purl.org/pe-repo/ocde/ford#2.02.05
Descripción
Sumario:Plantea la realización de cambios necesarios al sistema de reconocimiento de voz que controla a la calculadora estándar VOXAG. Este sistema utiliza el algoritmo de Coeficientes Cepstrales en Escala Mel (MFCC) y la plataforma PXI para implementar el procesamiento. Con base en la aplicación previamente desarrollada, se busca implementar la mejora principal del sistema: aumentar el tamaño del codeword de 8 a 16 centroides. Para esto es necesaria la revisión, el cambio y la actualización de varios de los subVIs presentes dentro de la aplicación. Una vez realizado el nuevo entrenamiento del sistema y preparados los Codebooks necesarios, se llevan a cabo las pruebas para evaluar cualitativamente la eficiencia, las cuales no alcanzan los resultados esperados, por lo que se determina que la longitud temporal de los comandos afecta significativamente esta nueva versión de la aplicación, y se concluye que son necesarios codebooks con comandos adaptados a la cantidad de centroides requeridos. Se observa también que el cambio a 16 centroides le permite al sistema tener un poco más de fortaleza ante el ruido.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).