Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital
Descripción del Articulo
El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profun...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Privada Antenor Orrego |
| Repositorio: | UPAO-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.upao.edu.pe:20.500.12759/61812 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12759/61812 |
| Nivel de acceso: | acceso abierto |
| Materia: | Redes Neuronales Profundas Separacion de Pistas Musicales https://purl.org/pe-repo/ocde/ford#2.11.00 |
| id |
UPAO_5513b60d47cca3220bdeba5867a9f967 |
|---|---|
| oai_identifier_str |
oai:repositorio.upao.edu.pe:20.500.12759/61812 |
| network_acronym_str |
UPAO |
| network_name_str |
UPAO-Tesis |
| repository_id_str |
3230 |
| dc.title.es_PE.fl_str_mv |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| title |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| spellingShingle |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital Escobedo Vallejos, Hugo César Redes Neuronales Profundas Separacion de Pistas Musicales https://purl.org/pe-repo/ocde/ford#2.11.00 |
| title_short |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| title_full |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| title_fullStr |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| title_full_unstemmed |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| title_sort |
Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digital |
| dc.creator.none.fl_str_mv |
Escobedo Vallejos, Hugo César |
| author |
Escobedo Vallejos, Hugo César |
| author_facet |
Escobedo Vallejos, Hugo César |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Azabache Fernández, Filiberto Melchor |
| dc.contributor.author.fl_str_mv |
Escobedo Vallejos, Hugo César |
| dc.subject.es_PE.fl_str_mv |
Redes Neuronales Profundas Separacion de Pistas Musicales |
| topic |
Redes Neuronales Profundas Separacion de Pistas Musicales https://purl.org/pe-repo/ocde/ford#2.11.00 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.11.00 |
| description |
El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profundas (DNN). Las DNN demostraron superar significativamente a los métodos tradicionales en precisión, reducción de artefactos y adaptación a señales complejas. Los algoritmos basados en STFT y SVD fueron implementados en MATLAB, mostrando resultados aceptables en señales específicas, pero limitaciones en resolución tiempo-frecuencia y manejo de señales no estacionarias. Por otro lado, los modelos DNN, diseñados y entrenados con bases de datos etiquetadas, lograron métricas superiores: SDR (18.9 dB), SIR (21.8 dB), SAR (16.5 dB) y PESQ (4.2), consolidándose como la técnica más efectiva para mejorar la calidad de separación. El análisis de los resultados de las métricas confirmó que las DNN son la solución más prometedora para futuras aplicaciones en la industria musical, el procesamiento de audio en tiempo real y la remasterización. Este estudio destaca la importancia de los avances en aprendizaje profundo para resolver desafíos complejos en el procesamiento de señales de audio. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-02-21T20:25:43Z |
| dc.date.available.none.fl_str_mv |
2025-02-21T20:25:43Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12759/61812 |
| url |
https://hdl.handle.net/20.500.12759/61812 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.relation.ispartofseries.none.fl_str_mv |
T_ELECT_18 |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Privada Antenor Orrego |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:UPAO-Tesis instname:Universidad Privada Antenor Orrego instacron:UPAO |
| instname_str |
Universidad Privada Antenor Orrego |
| instacron_str |
UPAO |
| institution |
UPAO |
| reponame_str |
UPAO-Tesis |
| collection |
UPAO-Tesis |
| bitstream.url.fl_str_mv |
https://repositorio.upao.edu.pe/backend/api/core/bitstreams/2add3b97-9bd4-4a7f-9faa-723510b3fb85/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/3e1db4f5-1638-43b4-aabf-897ab5cb2d3c/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0249e896-cd36-4813-b151-87df7ae09942/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4d22f5e8-fe44-47eb-841a-46d4ff751981/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8e9834d9-5b9e-4a31-b637-a14eac4ee2e8/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/5faeb4fe-e79c-4efa-bf18-9bfb1e469cd2/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/5f17eed2-d17b-4456-8b6e-317b28d452b4/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/2cd8b4bf-65e4-41ea-a2f3-1515ec779b24/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/593fd68a-a843-44f4-9ada-a22d0c9832e8/content https://repositorio.upao.edu.pe/backend/api/core/bitstreams/a4c91d6d-c1de-4614-8450-6b63e4a1b1ae/content |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 48c2ccd134647b348bc2d7a8113d5bdc 76d9b0c9c10d1105d4a1371021f29659 a1f1df0b46194ad50d9d2260eb08bbfa 542b98c5f10438aff6859a2069001a2b 0c59c0c8dcb565b4238700e0adfba288 68b329da9893e34099c7d8ad5cb9c940 1b1d040f3d43c764c184abe02f71a633 770a0ab59140f5de7c8b9ac359a64f47 762e2157b130e68e43c5ec814c09240b |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de la Universidad Privada Antenor Orrego |
| repository.mail.fl_str_mv |
dspace-help@myu.edu |
| _version_ |
1846069149343678464 |
| spelling |
Azabache Fernández, Filiberto MelchorEscobedo Vallejos, Hugo CésarEscobedo Vallejos, Hugo César2025-02-21T20:25:43Z2025-02-21T20:25:43Z2025https://hdl.handle.net/20.500.12759/61812El presente trabajo analiza y desarrolla métodos avanzados para la separación de pistas musicales de audio digital, comparando técnicas tradicionales como la Transformada de Fourier de Corto Tiempo (STFT) y la Descomposición en Valores Singulares (SVD) con enfoques basados en Redes Neuronales Profundas (DNN). Las DNN demostraron superar significativamente a los métodos tradicionales en precisión, reducción de artefactos y adaptación a señales complejas. Los algoritmos basados en STFT y SVD fueron implementados en MATLAB, mostrando resultados aceptables en señales específicas, pero limitaciones en resolución tiempo-frecuencia y manejo de señales no estacionarias. Por otro lado, los modelos DNN, diseñados y entrenados con bases de datos etiquetadas, lograron métricas superiores: SDR (18.9 dB), SIR (21.8 dB), SAR (16.5 dB) y PESQ (4.2), consolidándose como la técnica más efectiva para mejorar la calidad de separación. El análisis de los resultados de las métricas confirmó que las DNN son la solución más prometedora para futuras aplicaciones en la industria musical, el procesamiento de audio en tiempo real y la remasterización. Este estudio destaca la importancia de los avances en aprendizaje profundo para resolver desafíos complejos en el procesamiento de señales de audio.This study analyzes and develops advanced methods for the separation of musical tracks in digital audio, comparing traditional techniques such as Short-Time Fourier Transform (STFT) and Singular Value Decomposition (SVD) with approaches based on Deep Neural Networks (DNN). The DNNs significantly outperformed traditional methods in terms of precision, artifact reduction, and adaptability to complex signals. Algorithms based on STFT and SVD were implemented in MATLAB, showing acceptable results for specific signals but presenting limitations in time-frequency resolution and handling of non-stationary signals. In contrast, DNN models, designed and trained using labeled datasets, achieved superior metrics: SDR (18.9 dB), SIR (21.8 dB), SAR (16.5 dB), and PESQ (4.2), establishing themselves as the most effective technique for improving separation quality. The analysis of the metric results confirmed that DNNs are the most promising solution for future applications in the music industry, real-time audio processing, and remastering. This study highlights the importance of advancements in deep learning to address complex challenges in audio signal processingTesisapplication/pdfspaUniversidad Privada Antenor OrregoPET_ELECT_18SUNEDUinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Redes Neuronales ProfundasSeparacion de Pistas Musicaleshttps://purl.org/pe-repo/ocde/ford#2.11.00Implementación de redes neuronales profundas para mejorar la calidad de la separación de pistas musicales de audio digitalinfo:eu-repo/semantics/bachelorThesisreponame:UPAO-Tesisinstname:Universidad Privada Antenor Orregoinstacron:UPAOUniversidad Privada Antenor Orrego. Facultad de IngenieriaIngeniero ElectronicoIngenieria Electronicahttps://orcid.org/0000-0003-2833-04931785866018891264https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional712026De La Cruz Rodríguez, Oscar MiguelLeón Cerna, Alejandro MartínAlvarado Rodríguez, Luis enriqueLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.upao.edu.pe/backend/api/core/bitstreams/2add3b97-9bd4-4a7f-9faa-723510b3fb85/content8a4605be74aa9ea9d79846c1fba20a33MD54ORIGINALREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdfREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdfapplication/pdf1085789https://repositorio.upao.edu.pe/backend/api/core/bitstreams/3e1db4f5-1638-43b4-aabf-897ab5cb2d3c/content48c2ccd134647b348bc2d7a8113d5bdcMD51TURNITIN_ESCOBEDO.pdfTURNITIN_ESCOBEDO.pdfapplication/pdf4623276https://repositorio.upao.edu.pe/backend/api/core/bitstreams/0249e896-cd36-4813-b151-87df7ae09942/content76d9b0c9c10d1105d4a1371021f29659MD52AUTORIZACION_ESCOBEDO.pdfAUTORIZACION_ESCOBEDO.pdfapplication/pdf245277https://repositorio.upao.edu.pe/backend/api/core/bitstreams/4d22f5e8-fe44-47eb-841a-46d4ff751981/contenta1f1df0b46194ad50d9d2260eb08bbfaMD53TEXTREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdf.txtREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdf.txtExtracted texttext/plain81934https://repositorio.upao.edu.pe/backend/api/core/bitstreams/8e9834d9-5b9e-4a31-b637-a14eac4ee2e8/content542b98c5f10438aff6859a2069001a2bMD55TURNITIN_ESCOBEDO.pdf.txtTURNITIN_ESCOBEDO.pdf.txtExtracted texttext/plain975https://repositorio.upao.edu.pe/backend/api/core/bitstreams/5faeb4fe-e79c-4efa-bf18-9bfb1e469cd2/content0c59c0c8dcb565b4238700e0adfba288MD57AUTORIZACION_ESCOBEDO.pdf.txtAUTORIZACION_ESCOBEDO.pdf.txtExtracted texttext/plain1https://repositorio.upao.edu.pe/backend/api/core/bitstreams/5f17eed2-d17b-4456-8b6e-317b28d452b4/content68b329da9893e34099c7d8ad5cb9c940MD59THUMBNAILREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdf.jpgREP_HUGO.ESCOBEDO_REDES.NEURONALES.pdf.jpgGenerated Thumbnailimage/jpeg4271https://repositorio.upao.edu.pe/backend/api/core/bitstreams/2cd8b4bf-65e4-41ea-a2f3-1515ec779b24/content1b1d040f3d43c764c184abe02f71a633MD56TURNITIN_ESCOBEDO.pdf.jpgTURNITIN_ESCOBEDO.pdf.jpgGenerated Thumbnailimage/jpeg5124https://repositorio.upao.edu.pe/backend/api/core/bitstreams/593fd68a-a843-44f4-9ada-a22d0c9832e8/content770a0ab59140f5de7c8b9ac359a64f47MD58AUTORIZACION_ESCOBEDO.pdf.jpgAUTORIZACION_ESCOBEDO.pdf.jpgGenerated Thumbnailimage/jpeg6331https://repositorio.upao.edu.pe/backend/api/core/bitstreams/a4c91d6d-c1de-4614-8450-6b63e4a1b1ae/content762e2157b130e68e43c5ec814c09240bMD51020.500.12759/61812oai:repositorio.upao.edu.pe:20.500.12759/618122025-02-22 03:01:32.087https://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.upao.edu.peRepositorio de la Universidad Privada Antenor Orregodspace-help@myu.eduTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
12.828757 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).