Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital

Descripción del Articulo

El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profun...

Descripción completa

Detalles Bibliográficos
Autor: Escobedo Vallejos, Hugo César
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Privada Antenor Orrego
Repositorio:UPAO-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.upao.edu.pe:20.500.12759/61812
Enlace del recurso:https://hdl.handle.net/20.500.12759/61812
Nivel de acceso:acceso abierto
Materia:Redes Neuronales Profundas
Separacion de Pistas Musicales
https://purl.org/pe-repo/ocde/ford#2.11.00
Descripción
Sumario:El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profundas (DNN). Las DNN demostraron superar significativamente a los métodos tradicionales en precisión, reducción de artefactos y adaptación a señales complejas. Los algoritmos basados en STFT y SVD fueron implementados en MATLAB, mostrando resultados aceptables en señales específicas, pero limitaciones en resolución tiempo-frecuencia y manejo de señales no estacionarias. Por otro lado, los modelos DNN, diseñados y entrenados con bases de datos etiquetadas, lograron métricas superiores: SDR (18.9 dB), SIR (21.8 dB), SAR (16.5 dB) y PESQ (4.2), consolidándose como la técnica más efectiva para mejorar la calidad de separación. El análisis de los resultados de las métricas confirmó que las DNN son la solución más prometedora para futuras aplicaciones en la industria musical, el procesamiento de audio en tiempo real y la remasterización. Este estudio destaca la importancia de los avances en aprendizaje profundo para resolver desafíos complejos en el procesamiento de señales de audio.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).