Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática

Descripción del Articulo

La conversión de audio a texto mediante redes neuronales convolucionales (CNN) representa un avance significativo en la accesibilidad comunicativa, permitiendo la traducción de sonido a información escrita en tiempo real. Este estudio tiene como objetivo examinar críticamente las aplicaciones de las...

Descripción completa

Detalles Bibliográficos
Autor: Callirgos Burga, Cristhian Alejandro
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/15189
Enlace del recurso:https://hdl.handle.net/20.500.12802/15189
Nivel de acceso:acceso abierto
Materia:Redes neuronales convolucionales
Conversión de audio a texto
Accesibilidad comunicativa
MFCC
Espectrogramas
https://purl.org/pe-repo/ocde/ford#2.02.04
id USSS_0457af8b3e9e25ebb7cf4f7ed12428b7
oai_identifier_str oai:repositorio.uss.edu.pe:20.500.12802/15189
network_acronym_str USSS
network_name_str USS-Institucional
repository_id_str 4829
dc.title.es_PE.fl_str_mv Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
title Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
spellingShingle Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
Callirgos Burga, Cristhian Alejandro
Redes neuronales convolucionales
Conversión de audio a texto
Accesibilidad comunicativa
MFCC
Espectrogramas
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
title_full Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
title_fullStr Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
title_full_unstemmed Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
title_sort Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemática
author Callirgos Burga, Cristhian Alejandro
author_facet Callirgos Burga, Cristhian Alejandro
author_role author
dc.contributor.advisor.fl_str_mv Tuesta Monteza, Victor Alexci
dc.contributor.author.fl_str_mv Callirgos Burga, Cristhian Alejandro
dc.subject.es_PE.fl_str_mv Redes neuronales convolucionales
Conversión de audio a texto
Accesibilidad comunicativa
MFCC
Espectrogramas
topic Redes neuronales convolucionales
Conversión de audio a texto
Accesibilidad comunicativa
MFCC
Espectrogramas
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description La conversión de audio a texto mediante redes neuronales convolucionales (CNN) representa un avance significativo en la accesibilidad comunicativa, permitiendo la traducción de sonido a información escrita en tiempo real. Este estudio tiene como objetivo examinar críticamente las aplicaciones de las CNN en la conversión de audio a texto, comparando métodos de procesamiento, estándares de evaluación y limitaciones. La metodología empleada incluye una revisión sistemática de la literatura basada en las directrices PRISMA, utilizando bases de datos científicas como Scopus y ScienceDirect. Se analizaron 35 artículos relevantes, destacando que las arquitecturas GoogLeNet, ResNet y AlexNet son las más utilizadas, con precisiones de hasta el 89.61%. Las técnicas de preprocesamiento más eficaces incluyen los coeficientes cepstrales en frecuencia mel (MFCC) y los espectrogramas. La revisión concluye que, aunque las CNN son efectivas, enfrentan retos como la variabilidad del ambiente sonoro y la necesidad de bases de datos adaptadas a cada idioma. Esta investigación es crucial para mejorar la interacción y comunicación de personas con discapacidades auditivas y del habla mediante la tecnología y la inteligencia artificial.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-05-29T20:44:35Z
dc.date.available.none.fl_str_mv 2025-05-29T20:44:35Z
dc.date.issued.fl_str_mv 2025
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12802/15189
url https://hdl.handle.net/20.500.12802/15189
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Señor de Sipán
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - USS
Repositorio Institucional USS
dc.source.none.fl_str_mv reponame:USS-Institucional
instname:Universidad Señor de Sipan
instacron:USS
instname_str Universidad Señor de Sipan
instacron_str USS
institution USS
reponame_str USS-Institucional
collection USS-Institucional
bitstream.url.fl_str_mv https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/1/Callirgos%20Burga%20Cristhian%20Alejandro.pdf
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/2/Autorizaci%c3%b3n%20del%20autor.pdf
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/3/Informe%20de%20similitud.pdf
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/4/license_rdf
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/5/license.txt
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/6/Callirgos%20Burga%20Cristhian%20Alejandro.pdf.txt
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/8/Autorizaci%c3%b3n%20del%20autor.pdf.txt
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/10/Informe%20de%20similitud.pdf.txt
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/7/Callirgos%20Burga%20Cristhian%20Alejandro.pdf.jpg
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/9/Autorizaci%c3%b3n%20del%20autor.pdf.jpg
https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/11/Informe%20de%20similitud.pdf.jpg
bitstream.checksum.fl_str_mv 14d165d308bbd9c34fe3660de8d4bee9
c2d3eb5db6786ba245601e1bc04f4092
a4e1878e60140357e78028974c4d72b0
3655808e5dd46167956d6870b0f43800
8a4605be74aa9ea9d79846c1fba20a33
d4d590e05679c65aeb55baeb44128a95
84674d0d2877543a6bf6b7e90fe8cbf9
00925de8352fda697a2e1d89de8ffb0c
fa9e53322ba6854084b73e96df7c9441
3636104ed37655c400900d765bf6fc4f
84f0ceaf18efabfd43f5dae71cbe43e5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad Señor de Sipán
repository.mail.fl_str_mv repositorio@uss.edu.pe
_version_ 1845884162739798016
spelling Tuesta Monteza, Victor AlexciCallirgos Burga, Cristhian Alejandro2025-05-29T20:44:35Z2025-05-29T20:44:35Z2025https://hdl.handle.net/20.500.12802/15189La conversión de audio a texto mediante redes neuronales convolucionales (CNN) representa un avance significativo en la accesibilidad comunicativa, permitiendo la traducción de sonido a información escrita en tiempo real. Este estudio tiene como objetivo examinar críticamente las aplicaciones de las CNN en la conversión de audio a texto, comparando métodos de procesamiento, estándares de evaluación y limitaciones. La metodología empleada incluye una revisión sistemática de la literatura basada en las directrices PRISMA, utilizando bases de datos científicas como Scopus y ScienceDirect. Se analizaron 35 artículos relevantes, destacando que las arquitecturas GoogLeNet, ResNet y AlexNet son las más utilizadas, con precisiones de hasta el 89.61%. Las técnicas de preprocesamiento más eficaces incluyen los coeficientes cepstrales en frecuencia mel (MFCC) y los espectrogramas. La revisión concluye que, aunque las CNN son efectivas, enfrentan retos como la variabilidad del ambiente sonoro y la necesidad de bases de datos adaptadas a cada idioma. Esta investigación es crucial para mejorar la interacción y comunicación de personas con discapacidades auditivas y del habla mediante la tecnología y la inteligencia artificial.Trabajo de investigaciónCiencias de la información como herramientas multidisciplinares y estratégicas en el contexto industrial y de organizacionesInformática y transformación digital en el contexto industrial y organizacional.application/pdfspaUniversidad Señor de SipánPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Repositorio Institucional - USSRepositorio Institucional USSreponame:USS-Institucionalinstname:Universidad Señor de Sipaninstacron:USSRedes neuronales convolucionalesConversión de audio a textoAccesibilidad comunicativaMFCCEspectrogramashttps://purl.org/pe-repo/ocde/ford#2.02.04Redes neuronales convolucionales para la conversión de audio a texto: revisión sistemáticainfo:eu-repo/semantics/bachelorThesisSUNEDUUniversidad Señor de Sipán. Facultad de Ingeniería, Arquitectura y UrbanismoBachiller en Ingeniería de SistemasIngeniería de Sistemas42722929https://orcid.org/0000-0002-5913-990X70572620612076https://purl.org/pe-repo/renati/level#bachillerhttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALCallirgos Burga Cristhian Alejandro.pdfCallirgos Burga Cristhian Alejandro.pdfapplication/pdf768372https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/1/Callirgos%20Burga%20Cristhian%20Alejandro.pdf14d165d308bbd9c34fe3660de8d4bee9MD51Autorización del autor.pdfAutorización del autor.pdfapplication/pdf154056https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/2/Autorizaci%c3%b3n%20del%20autor.pdfc2d3eb5db6786ba245601e1bc04f4092MD52Informe de similitud.pdfInforme de similitud.pdfapplication/pdf826664https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/3/Informe%20de%20similitud.pdfa4e1878e60140357e78028974c4d72b0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/4/license_rdf3655808e5dd46167956d6870b0f43800MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55TEXTCallirgos Burga Cristhian Alejandro.pdf.txtCallirgos Burga Cristhian Alejandro.pdf.txtExtracted texttext/plain53016https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/6/Callirgos%20Burga%20Cristhian%20Alejandro.pdf.txtd4d590e05679c65aeb55baeb44128a95MD56Autorización del autor.pdf.txtAutorización del autor.pdf.txtExtracted texttext/plain2182https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/8/Autorizaci%c3%b3n%20del%20autor.pdf.txt84674d0d2877543a6bf6b7e90fe8cbf9MD58Informe de similitud.pdf.txtInforme de similitud.pdf.txtExtracted texttext/plain37207https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/10/Informe%20de%20similitud.pdf.txt00925de8352fda697a2e1d89de8ffb0cMD510THUMBNAILCallirgos Burga Cristhian Alejandro.pdf.jpgCallirgos Burga Cristhian Alejandro.pdf.jpgGenerated Thumbnailimage/jpeg8996https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/7/Callirgos%20Burga%20Cristhian%20Alejandro.pdf.jpgfa9e53322ba6854084b73e96df7c9441MD57Autorización del autor.pdf.jpgAutorización del autor.pdf.jpgGenerated Thumbnailimage/jpeg9402https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/9/Autorizaci%c3%b3n%20del%20autor.pdf.jpg3636104ed37655c400900d765bf6fc4fMD59Informe de similitud.pdf.jpgInforme de similitud.pdf.jpgGenerated Thumbnailimage/jpeg5845https://repositorio.uss.edu.pe/bitstream/20.500.12802/15189/11/Informe%20de%20similitud.pdf.jpg84f0ceaf18efabfd43f5dae71cbe43e5MD51120.500.12802/15189oai:repositorio.uss.edu.pe:20.500.12802/151892025-05-30 03:03:03.462Repositorio Institucional de la Universidad Señor de Sipánrepositorio@uss.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.065919
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).