Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
Descripción del Articulo
Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2024 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/30275 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/30275 |
| Nivel de acceso: | acceso abierto |
| Materia: | Síntesis del habla Shipibo-Conibo Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_27956b23e2ddfa03e408f73cfad95eaf |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/30275 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.none.fl_str_mv |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| title |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| spellingShingle |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo Menéndez Quinto, Daniel Arturo Síntesis del habla Shipibo-Conibo Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| title_full |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| title_fullStr |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| title_full_unstemmed |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| title_sort |
Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo |
| author |
Menéndez Quinto, Daniel Arturo |
| author_facet |
Menéndez Quinto, Daniel Arturo |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Gómez Montoya, Héctor Erasmo |
| dc.contributor.author.fl_str_mv |
Menéndez Quinto, Daniel Arturo |
| dc.subject.none.fl_str_mv |
Síntesis del habla Shipibo-Conibo Lenguas indígenas--Perú |
| topic |
Síntesis del habla Shipibo-Conibo Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas de comunicación y valiosas maneras de comprender el mundo. Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo que lo clasifica como una lengua de pocos recursos. En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz (TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder, superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad. Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo. Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas de la familia pano u otras lenguas amazónicas. |
| publishDate |
2024 |
| dc.date.created.none.fl_str_mv |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2025-03-18T15:14:49Z |
| dc.date.issued.fl_str_mv |
2025-03-18 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/30275 |
| url |
http://hdl.handle.net/20.500.12404/30275 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-sa/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-sa/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.none.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/9b908efb-985e-44f4-80cf-c81aa4f8568b/download https://tesis.pucp.edu.pe/bitstreams/df9f2b14-0315-406b-881b-207e78b572d6/download https://tesis.pucp.edu.pe/bitstreams/34034fea-9bed-4033-85bd-cbc84beb5978/download https://tesis.pucp.edu.pe/bitstreams/91dc36d9-1aa8-40c7-9bd3-420b2f279977/download https://tesis.pucp.edu.pe/bitstreams/7520200c-d80f-4961-b6c6-f365d9d26b3f/download https://tesis.pucp.edu.pe/bitstreams/f8054d79-ad69-4dd3-a1b4-c0499fde0933/download https://tesis.pucp.edu.pe/bitstreams/c8952941-d257-4461-b26b-053c929d794e/download https://tesis.pucp.edu.pe/bitstreams/5ff9d944-65fc-41d5-88a3-0157cec04d71/download |
| bitstream.checksum.fl_str_mv |
f19568739f00c446907b85179943eb17 cb4e6d48e6513e477d8351f578e1a742 85e50b88013d0c13f136d8bfc3dd4616 bb9bdc0b3349e4284e09149f943790b4 88d555976c1f97ee1e38e116efa31fe3 5fd194cb5e2097010a824c01a277503f c2d69cc7c0aa94055efc656b84a966b4 be3fefe3b402540d532e19fa5ccd1a8b |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834736888121917440 |
| spelling |
Gómez Montoya, Héctor ErasmoMenéndez Quinto, Daniel Arturo2025-03-18T15:14:49Z20242025-03-18http://hdl.handle.net/20.500.12404/30275Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas de comunicación y valiosas maneras de comprender el mundo. Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo que lo clasifica como una lengua de pocos recursos. En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz (TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder, superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad. Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo. Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas de la familia pano u otras lenguas amazónicas.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/2.5/pe/Síntesis del hablaShipibo-ConiboLenguas indígenas--Perúhttps://purl.org/pe-repo/ocde/ford#1.02.00Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Koniboinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación70599170https://orcid.org/0000-0002-1338-339242735246611087Melgar Sasieta, Hector AndresGómez Montoya, Héctor ErasmoSobrevilla Cabezudo, Marco Antoniohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdfMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdfTexto completoapplication/pdf443799https://tesis.pucp.edu.pe/bitstreams/9b908efb-985e-44f4-80cf-c81aa4f8568b/downloadf19568739f00c446907b85179943eb17MD51trueAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdfMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdfReporte de originalidadapplication/pdf2480696https://tesis.pucp.edu.pe/bitstreams/df9f2b14-0315-406b-881b-207e78b572d6/downloadcb4e6d48e6513e477d8351f578e1a742MD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81160https://tesis.pucp.edu.pe/bitstreams/34034fea-9bed-4033-85bd-cbc84beb5978/download85e50b88013d0c13f136d8bfc3dd4616MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/91dc36d9-1aa8-40c7-9bd3-420b2f279977/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.txtMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.txtExtracted texttext/plain45596https://tesis.pucp.edu.pe/bitstreams/7520200c-d80f-4961-b6c6-f365d9d26b3f/download88d555976c1f97ee1e38e116efa31fe3MD55falseAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.txtMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.txtExtracted texttext/plain1219https://tesis.pucp.edu.pe/bitstreams/f8054d79-ad69-4dd3-a1b4-c0499fde0933/download5fd194cb5e2097010a824c01a277503fMD57falseAdministratorREADTHUMBNAILMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.jpgMENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf.jpgGenerated Thumbnailimage/jpeg10291https://tesis.pucp.edu.pe/bitstreams/c8952941-d257-4461-b26b-053c929d794e/downloadc2d69cc7c0aa94055efc656b84a966b4MD56falseAnonymousREADMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.jpgMENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf.jpgGenerated Thumbnailimage/jpeg8362https://tesis.pucp.edu.pe/bitstreams/5ff9d944-65fc-41d5-88a3-0157cec04d71/downloadbe3fefe3b402540d532e19fa5ccd1a8bMD58falseAdministratorREAD20.500.12404/30275oai:tesis.pucp.edu.pe:20.500.12404/302752025-04-21 12:14:06.307http://creativecommons.org/licenses/by-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.92416 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).