Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua

Descripción del Articulo

La presente tesis tiene corno fin implementar un conversor de texto a voz, herramienta tecnológica, utilizando la técnica de concatenación de unidades básicas "difonemas", para la síntesis de voz del idioma1 quechua con alfabeto pentavocálico y frecuente en la región Cusco. Se identificaro...

Descripción completa

Detalles Bibliográficos
Autor: Sánchez Espirilla, Gabriela
Formato: tesis de grado
Fecha de Publicación:2016
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/2458
Enlace del recurso:http://hdl.handle.net/20.500.12918/2458
Nivel de acceso:acceso cerrado
Materia:Conversor de texto a voz
Concatenación de difonemas
Síntesis de voz
Quechua
Corpus de voz
Transcripción fonética
TD-PSOLA
http://purl.org/pe-repo/ocde/ford#2.02.03
id RUNS_f0fbf05ebd3b4e38c5377b7f3838f355
oai_identifier_str oai:repositorio.unsaac.edu.pe:20.500.12918/2458
network_acronym_str RUNS
network_name_str UNSAAC-Institucional
repository_id_str
dc.title.es_PE.fl_str_mv Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
title Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
spellingShingle Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
Sánchez Espirilla, Gabriela
Conversor de texto a voz
Concatenación de difonemas
Síntesis de voz
Quechua
Corpus de voz
Transcripción fonética
TD-PSOLA
http://purl.org/pe-repo/ocde/ford#2.02.03
title_short Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
title_full Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
title_fullStr Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
title_full_unstemmed Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
title_sort Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechua
author Sánchez Espirilla, Gabriela
author_facet Sánchez Espirilla, Gabriela
author_role author
dc.contributor.advisor.fl_str_mv Palma Ttito, Luis Beltrán
dc.contributor.author.fl_str_mv Sánchez Espirilla, Gabriela
dc.subject.es_PE.fl_str_mv Conversor de texto a voz
Concatenación de difonemas
Síntesis de voz
Quechua
Corpus de voz
Transcripción fonética
TD-PSOLA
topic Conversor de texto a voz
Concatenación de difonemas
Síntesis de voz
Quechua
Corpus de voz
Transcripción fonética
TD-PSOLA
http://purl.org/pe-repo/ocde/ford#2.02.03
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#2.02.03
description La presente tesis tiene corno fin implementar un conversor de texto a voz, herramienta tecnológica, utilizando la técnica de concatenación de unidades básicas "difonemas", para la síntesis de voz del idioma1 quechua con alfabeto pentavocálico y frecuente en la región Cusco. Se identificaron dos momentos claves para llevar a cabo el trabajo. Primero, se construyó el corpus de voz y la base de datos para dicho idioma. Para lo cual, inicialmente, se identificaron los difonemas válidos y propios del idioma quechua; para ello, previamente, se realizó una aproximación al estudio de la lingüística del idioma. Seguidamente, se realizaron las grabaciones de las frases y palabras portadoras de dichos difonemas; esto para el etiquetado y extracción de los mismos. La información obtenida en este punto sirvió para la construcción de la base de datos de difonemas para el idioma quechua. Segundo, se construyó el sintetizador de voz. Para lo cual, se identificaron dos bloques, del procesamiento del lenguaje natural, y del procesamiento digital de la señal. El primer bloque comprende la extracción y el análisis de la oración para la elaboración del fichero de transcripción fonética de los difonemas que componen dicha oración. El segundo bloque se encarga de procesar la transcripción obtenida en el bloque anterior con la ayuda de diferentes algoritmos para convertirla en voz. Este utilizó una técnica llamada TD-PSOLA y otras para suavizar la unión de difonemas. La creación de la herramienta en mención; así como, su uso y futura mejora; aprovecha las ventajas de las tecnologías del habla y conversión de texto a voz para aspirar ser un ejemplar de aquellas escasas tecnologías de información y comunicación para idiomas confinados al hogar y a generaciones mayores2 como el quechua. Este busca democratizar el acceso a la información y los avances tecnológicos a personas quechua hablantes buscando desarrollar capacidades. Además, ésta busca rechazar la idea que el idioma quechua resulta inadecuado para transmitir los avances y desarrollos de las ciencias y las artes. Dicho de esta manera, es notable la ausencia de herramientas tecnológicas para la enseñanza del idioma quechua en diferentes campos donde podría complementar los aprendizajes, para ejemplo están los proyectos de alfabetización y educación intercultural bilingüe, sistemas de lectura para invidentes, entre otros. En conclusión, se implementó un conversor de texto escrito a voz utilizando la estrategia de concatenación de difonemas para el idioma quechua de la familia lingüística denominada Cusco - Collao.
publishDate 2016
dc.date.accessioned.none.fl_str_mv 2017-12-27T15:32:46Z
dc.date.available.none.fl_str_mv 2017-12-27T15:32:46Z
dc.date.issued.fl_str_mv 2016
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.other.none.fl_str_mv 253T20160080
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12918/2458
identifier_str_mv 253T20160080
url http://hdl.handle.net/20.500.12918/2458
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/closedAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv closedAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.en_US.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
dc.publisher.country.none.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
Repositorio Institucional - UNSAAC
dc.source.none.fl_str_mv reponame:UNSAAC-Institucional
instname:Universidad Nacional de San Antonio Abad del Cusco
instacron:UNSAAC
instname_str Universidad Nacional de San Antonio Abad del Cusco
instacron_str UNSAAC
institution UNSAAC
reponame_str UNSAAC-Institucional
collection UNSAAC-Institucional
bitstream.url.fl_str_mv http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/2458/1/253T20160080.pdf
http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/2458/2/253T20160080.pdf.txt
bitstream.checksum.fl_str_mv b5769ca1766cd2f16865db27df06cc95
4655847c8fb9b9f7ba8e42de5060962f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv DSpace de la UNSAAC
repository.mail.fl_str_mv soporte.repositorio@unsaac.edu.pe
_version_ 1742881425743413248
spelling Palma Ttito, Luis BeltránSánchez Espirilla, Gabriela2017-12-27T15:32:46Z2017-12-27T15:32:46Z2016253T20160080http://hdl.handle.net/20.500.12918/2458La presente tesis tiene corno fin implementar un conversor de texto a voz, herramienta tecnológica, utilizando la técnica de concatenación de unidades básicas "difonemas", para la síntesis de voz del idioma1 quechua con alfabeto pentavocálico y frecuente en la región Cusco. Se identificaron dos momentos claves para llevar a cabo el trabajo. Primero, se construyó el corpus de voz y la base de datos para dicho idioma. Para lo cual, inicialmente, se identificaron los difonemas válidos y propios del idioma quechua; para ello, previamente, se realizó una aproximación al estudio de la lingüística del idioma. Seguidamente, se realizaron las grabaciones de las frases y palabras portadoras de dichos difonemas; esto para el etiquetado y extracción de los mismos. La información obtenida en este punto sirvió para la construcción de la base de datos de difonemas para el idioma quechua. Segundo, se construyó el sintetizador de voz. Para lo cual, se identificaron dos bloques, del procesamiento del lenguaje natural, y del procesamiento digital de la señal. El primer bloque comprende la extracción y el análisis de la oración para la elaboración del fichero de transcripción fonética de los difonemas que componen dicha oración. El segundo bloque se encarga de procesar la transcripción obtenida en el bloque anterior con la ayuda de diferentes algoritmos para convertirla en voz. Este utilizó una técnica llamada TD-PSOLA y otras para suavizar la unión de difonemas. La creación de la herramienta en mención; así como, su uso y futura mejora; aprovecha las ventajas de las tecnologías del habla y conversión de texto a voz para aspirar ser un ejemplar de aquellas escasas tecnologías de información y comunicación para idiomas confinados al hogar y a generaciones mayores2 como el quechua. Este busca democratizar el acceso a la información y los avances tecnológicos a personas quechua hablantes buscando desarrollar capacidades. Además, ésta busca rechazar la idea que el idioma quechua resulta inadecuado para transmitir los avances y desarrollos de las ciencias y las artes. Dicho de esta manera, es notable la ausencia de herramientas tecnológicas para la enseñanza del idioma quechua en diferentes campos donde podría complementar los aprendizajes, para ejemplo están los proyectos de alfabetización y educación intercultural bilingüe, sistemas de lectura para invidentes, entre otros. En conclusión, se implementó un conversor de texto escrito a voz utilizando la estrategia de concatenación de difonemas para el idioma quechua de la familia lingüística denominada Cusco - Collao.Tesisapplication/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/closedAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Universidad Nacional de San Antonio Abad del CuscoRepositorio Institucional - UNSAACreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACConversor de texto a vozConcatenación de difonemasSíntesis de vozQuechuaCorpus de vozTranscripción fonéticaTD-PSOLAhttp://purl.org/pe-repo/ocde/ford#2.02.03Conversor de texto escrito a voz por concatenación de difonemas para el idioma quechuainfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniero Informático y de SistemasUniversidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y MecánicaTítulo profesionalIngeniería Informática y de Sistemas4364524823949672http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#tituloProfesional612296ORIGINAL253T20160080.pdfapplication/pdf69275http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/2458/1/253T20160080.pdfb5769ca1766cd2f16865db27df06cc95MD51TEXT253T20160080.pdf.txt253T20160080.pdf.txtExtracted texttext/plain3928http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/2458/2/253T20160080.pdf.txt4655847c8fb9b9f7ba8e42de5060962fMD5220.500.12918/2458oai:repositorio.unsaac.edu.pe:20.500.12918/24582021-07-27 21:39:48.144DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe
score 13.958958
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).