Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo

Descripción del Articulo

Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas...

Descripción completa

Detalles Bibliográficos
Autor: Menéndez Quinto, Daniel Arturo
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/30275
Enlace del recurso:http://hdl.handle.net/20.500.12404/30275
Nivel de acceso:acceso abierto
Materia:Síntesis del habla
Shipibo-Conibo
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_27956b23e2ddfa03e408f73cfad95eaf
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/30275
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.none.fl_str_mv Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
title Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
spellingShingle Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
Menéndez Quinto, Daniel Arturo
Síntesis del habla
Shipibo-Conibo
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
title_full Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
title_fullStr Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
title_full_unstemmed Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
title_sort Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
author Menéndez Quinto, Daniel Arturo
author_facet Menéndez Quinto, Daniel Arturo
author_role author
dc.contributor.advisor.fl_str_mv Gómez Montoya, Héctor Erasmo
dc.contributor.author.fl_str_mv Menéndez Quinto, Daniel Arturo
dc.subject.none.fl_str_mv Síntesis del habla
Shipibo-Conibo
Lenguas indígenas--Perú
topic Síntesis del habla
Shipibo-Conibo
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas de comunicación y valiosas maneras de comprender el mundo. Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo que lo clasifica como una lengua de pocos recursos. En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz (TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder, superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad. Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo. Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas de la familia pano u otras lenguas amazónicas.
publishDate 2024
dc.date.created.none.fl_str_mv 2024
dc.date.accessioned.none.fl_str_mv 2025-03-18T15:14:49Z
dc.date.issued.fl_str_mv 2025-03-18
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/30275
url http://hdl.handle.net/20.500.12404/30275
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/9b908efb-985e-44f4-80cf-c81aa4f8568b/download
https://tesis.pucp.edu.pe/bitstreams/df9f2b14-0315-406b-881b-207e78b572d6/download
https://tesis.pucp.edu.pe/bitstreams/34034fea-9bed-4033-85bd-cbc84beb5978/download
https://tesis.pucp.edu.pe/bitstreams/91dc36d9-1aa8-40c7-9bd3-420b2f279977/download
https://tesis.pucp.edu.pe/bitstreams/7520200c-d80f-4961-b6c6-f365d9d26b3f/download
https://tesis.pucp.edu.pe/bitstreams/f8054d79-ad69-4dd3-a1b4-c0499fde0933/download
https://tesis.pucp.edu.pe/bitstreams/c8952941-d257-4461-b26b-053c929d794e/download
https://tesis.pucp.edu.pe/bitstreams/5ff9d944-65fc-41d5-88a3-0157cec04d71/download
bitstream.checksum.fl_str_mv f19568739f00c446907b85179943eb17
cb4e6d48e6513e477d8351f578e1a742
85e50b88013d0c13f136d8bfc3dd4616
bb9bdc0b3349e4284e09149f943790b4
88d555976c1f97ee1e38e116efa31fe3
5fd194cb5e2097010a824c01a277503f
c2d69cc7c0aa94055efc656b84a966b4
be3fefe3b402540d532e19fa5ccd1a8b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736888121917440
spelling Gómez Montoya, Héctor ErasmoMenéndez Quinto, Daniel Arturo2025-03-18T15:14:49Z20242025-03-18http://hdl.handle.net/20.500.12404/30275Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas de comunicación y valiosas maneras de comprender el mundo. Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo que lo clasifica como una lengua de pocos recursos. En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz (TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder, superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad. Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo. Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas de la familia pano u otras lenguas amazónicas.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/2.5/pe/Síntesis del hablaShipibo-ConiboLenguas indígenas--Perúhttps://purl.org/pe-repo/ocde/ford#1.02.00Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Koniboinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación70599170https://orcid.org/0000-0002-1338-339242735246611087Melgar Sasieta, Hector AndresGómez Montoya, Héctor ErasmoSobrevilla Cabezudo, Marco Antoniohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdfMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdfTexto completoapplication/pdf443799https://tesis.pucp.edu.pe/bitstreams/9b908efb-985e-44f4-80cf-c81aa4f8568b/downloadf19568739f00c446907b85179943eb17MD51trueAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdfMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdfReporte de originalidadapplication/pdf2480696https://tesis.pucp.edu.pe/bitstreams/df9f2b14-0315-406b-881b-207e78b572d6/downloadcb4e6d48e6513e477d8351f578e1a742MD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81160https://tesis.pucp.edu.pe/bitstreams/34034fea-9bed-4033-85bd-cbc84beb5978/download85e50b88013d0c13f136d8bfc3dd4616MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/91dc36d9-1aa8-40c7-9bd3-420b2f279977/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.txtMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.txtExtracted texttext/plain45596https://tesis.pucp.edu.pe/bitstreams/7520200c-d80f-4961-b6c6-f365d9d26b3f/download88d555976c1f97ee1e38e116efa31fe3MD55falseAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.txtMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.txtExtracted texttext/plain1219https://tesis.pucp.edu.pe/bitstreams/f8054d79-ad69-4dd3-a1b4-c0499fde0933/download5fd194cb5e2097010a824c01a277503fMD57falseAdministratorREADTHUMBNAILMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.jpgMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.jpgGenerated Thumbnailimage/jpeg10291https://tesis.pucp.edu.pe/bitstreams/c8952941-d257-4461-b26b-053c929d794e/downloadc2d69cc7c0aa94055efc656b84a966b4MD56falseAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.jpgMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.jpgGenerated Thumbnailimage/jpeg8362https://tesis.pucp.edu.pe/bitstreams/5ff9d944-65fc-41d5-88a3-0157cec04d71/downloadbe3fefe3b402540d532e19fa5ccd1a8bMD58falseAdministratorREAD20.500.12404/30275oai:tesis.pucp.edu.pe:20.500.12404/302752025-04-21 12:14:06.307http://creativecommons.org/licenses/by-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.92416
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).