Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
Descripción del Articulo
Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por la...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2017 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/145700 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/8325 |
Nivel de acceso: | acceso abierto |
Materia: | Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
RPUC_9a1787f9fd0b5c94bd76987436167bda |
---|---|
oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/145700 |
network_acronym_str |
RPUC |
network_name_str |
PUCP-Institucional |
repository_id_str |
2905 |
spelling |
Melgar Sasieta, Héctor AndrésOncevay Marcos, Félix ArturoGalarreta Asian, Ana Paula2017-03-31T21:15:54Z2017-03-31T21:15:54Z20172017-03-312018-01-01http://hdl.handle.net/20.500.12404/8325Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Traductores--Programas para computadorasTraductores--Métodos estadísticosTraductores--Shipibo-ConiboTraductores--Lenguas indígenasTraductores--Españolhttps://purl.org/pe-repo/ocde/ford#1.02.00Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y españolinfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoInformática con mención en Ciencias de la Computación10145776611087https://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#tesis20.500.14657/145700oai:repositorio.pucp.edu.pe:20.500.14657/1457002024-06-10 10:11:02.144http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
dc.title.es_ES.fl_str_mv |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
title |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
spellingShingle |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español Galarreta Asian, Ana Paula Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
title_full |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
title_fullStr |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
title_full_unstemmed |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
title_sort |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
author |
Galarreta Asian, Ana Paula |
author_facet |
Galarreta Asian, Ana Paula |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Melgar Sasieta, Héctor Andrés Oncevay Marcos, Félix Arturo |
dc.contributor.author.fl_str_mv |
Galarreta Asian, Ana Paula |
dc.subject.es_ES.fl_str_mv |
Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español |
topic |
Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. |
publishDate |
2017 |
dc.date.accessioned.es_ES.fl_str_mv |
2017-03-31T21:15:54Z |
dc.date.available.es_ES.fl_str_mv |
2017-03-31T21:15:54Z |
dc.date.created.es_ES.fl_str_mv |
2017 |
dc.date.EmbargoEnd.none.fl_str_mv |
2018-01-01 |
dc.date.issued.fl_str_mv |
2017-03-31 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.other.none.fl_str_mv |
Tesis de maestría |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/8325 |
url |
http://hdl.handle.net/20.500.12404/8325 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Institucional |
collection |
PUCP-Institucional |
repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
repository.mail.fl_str_mv |
repositorio@pucp.pe |
_version_ |
1835638206714871808 |
score |
13.914502 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).