Extracción de características basada en NMF para la clasificación de especies de aves usando señales de audio

Descripción del Articulo

Habitualmente para sistemas de clasificación de audio, por ejemplo, para la clasificación acústica de especies de aves, las técnicas de parametrización basadas en los Coeficientes Cepstrales a escala de Frecuencias Mel (MFCC) se usan en la fase de extracción de características. Sin embargo, sucede q...

Descripción completa

Detalles Bibliográficos
Autor: Quispe Soncco, Raisa Soledad
Formato: tesis de grado
Fecha de Publicación:2017
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/15495
Enlace del recurso:https://hdl.handle.net/20.500.12590/15495
Nivel de acceso:acceso abierto
Materia:Sistemas de clasificación de audios
Técnicas de parametrización
Factorización de Matrices No Negativas (NMF)
Escala Mel
https://purl.org/pe-repo/ocde/ford#2.02.05
Descripción
Sumario:Habitualmente para sistemas de clasificación de audio, por ejemplo, para la clasificación acústica de especies de aves, las técnicas de parametrización basadas en los Coeficientes Cepstrales a escala de Frecuencias Mel (MFCC) se usan en la fase de extracción de características. Sin embargo, sucede que aunque esta técnica proporciona buenos resultados, no es muy adecuada, ya que fue creada para el reconocimiento automático de la voz humana (ASR). En esta tesis de grado, se busca mejorar el proceso de extracción de características mediante una nueva parametrización utilizando el método basado en la Factorización de Matrices No Negativas (NMF), específicamente en la mejora del banco de filtros convencional a escala Mel, utilizado para obtener los coeficientes cepstrales. NMF ha demostrado ser una herramienta fundamental para la representación de señales de audio. Los resultados experimentales han demostrado que el aprendizaje del banco de filtros auditivo basado en la técnica NMF, en comparación con el banco de filtros a escala Mel, proporciona mejores tasas de clasificación, considerando un esquema de clasificación basado en la Máquina de Vectores de Soporte (SVM).
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).