Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital
Descripción del Articulo
El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profun...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Privada Antenor Orrego |
| Repositorio: | UPAO-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.upao.edu.pe:20.500.12759/61812 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12759/61812 |
| Nivel de acceso: | acceso abierto |
| Materia: | Redes Neuronales Profundas Separacion de Pistas Musicales https://purl.org/pe-repo/ocde/ford#2.11.00 |
| Sumario: | El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profundas (DNN). Las DNN demostraron superar significativamente a los métodos tradicionales en precisión, reducción de artefactos y adaptación a señales complejas. Los algoritmos basados en STFT y SVD fueron implementados en MATLAB, mostrando resultados aceptables en señales específicas, pero limitaciones en resolución tiempo-frecuencia y manejo de señales no estacionarias. Por otro lado, los modelos DNN, diseñados y entrenados con bases de datos etiquetadas, lograron métricas superiores: SDR (18.9 dB), SIR (21.8 dB), SAR (16.5 dB) y PESQ (4.2), consolidándose como la técnica más efectiva para mejorar la calidad de separación. El análisis de los resultados de las métricas confirmó que las DNN son la solución más prometedora para futuras aplicaciones en la industria musical, el procesamiento de audio en tiempo real y la remasterización. Este estudio destaca la importancia de los avances en aprendizaje profundo para resolver desafíos complejos en el procesamiento de señales de audio. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).