Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
Descripción del Articulo
Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por la...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2017 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/8325 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/8325 |
| Nivel de acceso: | acceso abierto |
| Materia: | Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_0fd4eaaf10b67ae843b5fab2afa5eada |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/8325 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| title |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| spellingShingle |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español Galarreta Asian, Ana Paula Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| title_full |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| title_fullStr |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| title_full_unstemmed |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| title_sort |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español |
| author |
Galarreta Asian, Ana Paula |
| author_facet |
Galarreta Asian, Ana Paula |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Melgar Sasieta, Héctor Andrés Oncevay Marcos, Félix Arturo |
| dc.contributor.author.fl_str_mv |
Galarreta Asian, Ana Paula |
| dc.subject.es_ES.fl_str_mv |
Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español |
| topic |
Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. |
| publishDate |
2017 |
| dc.date.accessioned.es_ES.fl_str_mv |
2017-03-31T21:15:54Z |
| dc.date.available.es_ES.fl_str_mv |
2017-03-31T21:15:54Z |
| dc.date.created.es_ES.fl_str_mv |
2017 |
| dc.date.EmbargoEnd.none.fl_str_mv |
2018-01-01 |
| dc.date.issued.fl_str_mv |
2017-03-31 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/8325 |
| url |
http://hdl.handle.net/20.500.12404/8325 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/fc208b10-d3ec-462b-989e-8c860bfb05b2/download https://tesis.pucp.edu.pe/bitstreams/523e9c10-8b23-4846-912c-100b2c99ce84/download https://tesis.pucp.edu.pe/bitstreams/cbeac33f-4cdb-47d9-905b-a6f7f474421d/download https://tesis.pucp.edu.pe/bitstreams/e58f9bed-956a-43dc-b944-8729d323af66/download https://tesis.pucp.edu.pe/bitstreams/eaced3c7-bdb4-4c5b-a442-cb185546848a/download |
| bitstream.checksum.fl_str_mv |
27aebf468cd68dc7eda8cba25fc5f3a8 08ba140f7a42e8481bccb428ca3bfa38 78fbcb528ed107d89fa91de744ce17de 92c51c55bf6bb5ee53109e155ddf3fe2 bad4aa2205a0f156c2d4d186f993e074 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1839177506790309888 |
| spelling |
Melgar Sasieta, Héctor AndrésOncevay Marcos, Félix ArturoGalarreta Asian, Ana Paula2017-03-31T21:15:54Z2017-03-31T21:15:54Z20172017-03-312018-01-01http://hdl.handle.net/20.500.12404/8325Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Traductores--Programas para computadorasTraductores--Métodos estadísticosTraductores--Shipibo-ConiboTraductores--Lenguas indígenasTraductores--Españolhttps://purl.org/pe-repo/ocde/ford#1.02.00Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y españolinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoInformática con mención en Ciencias de la Computación10145776611087https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisCC-LICENSElicense_rdf.rdflicense_rdf.rdfapplication/rdf+xml; charset=utf-8810https://tesis.pucp.edu.pe/bitstreams/fc208b10-d3ec-462b-989e-8c860bfb05b2/download27aebf468cd68dc7eda8cba25fc5f3a8MD55falseAnonymousREADORIGINALGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdfGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdfTexto completoapplication/pdf7244337https://tesis.pucp.edu.pe/bitstreams/523e9c10-8b23-4846-912c-100b2c99ce84/download08ba140f7a42e8481bccb428ca3bfa38MD51trueAnonymousREAD2018-01-01LICENSElicense.txtlicense.txttext/plain; charset=utf-81364https://tesis.pucp.edu.pe/bitstreams/cbeac33f-4cdb-47d9-905b-a6f7f474421d/download78fbcb528ed107d89fa91de744ce17deMD52falseAnonymousREADTHUMBNAILGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdf.jpgGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdf.jpgIM Thumbnailimage/jpeg14201https://tesis.pucp.edu.pe/bitstreams/e58f9bed-956a-43dc-b944-8729d323af66/download92c51c55bf6bb5ee53109e155ddf3fe2MD53falseAnonymousREADTEXTGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdf.txtGALARRETA_ANA_CORPUS_TRADUCTOR_AUTOMATICO_SHIPIBO-KONIBO.pdf.txtExtracted texttext/plain118006https://tesis.pucp.edu.pe/bitstreams/eaced3c7-bdb4-4c5b-a442-cb185546848a/downloadbad4aa2205a0f156c2d4d186f993e074MD54falseAdministratorREAD20.500.12404/8325oai:tesis.pucp.edu.pe:20.500.12404/83252025-07-18 12:54:42.787http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peQ29uIGxhIGF1dG9yaXphY2nDs24gZGUgZGVww7NzaXRvIGRlIG1pIHRlc2lzLCBvdG9yZ28gYSBsYSBQb250aWZpY2lhIFVuaXZlcnNpZGFkIENhdMOzbGljYSBkZWwgUGVyw7ogdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSBwYXJhIHJlcHJvZHVjaXIsIGRpc3RyaWJ1aXIsIGNvbXVuaWNhciBhbCBww7pibGljbywgdHJhbnNmb3JtYXIKKMO6bmljYW1lbnRlIG1lZGlhbnRlIHN1IHRyYWR1Y2Npw7NuIGEgb3Ryb3MgaWRpb21hcykgeSBwb25lciBhIGRpc3Bvc2ljacOzbiBkZWwgcMO6YmxpY28gbWkgdGVzaXMgKGluY2x1aWRvIGVsIHJlc3VtZW4pLCBlbiBmb3JtYXRvIGbDrXNpY28gbyBkaWdpdGFsLCBlbiBjdWFscXVpZXIgbWVkaW8sIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXJzZSwKYSB0cmF2w6lzIGRlIGxvcyBkaXZlcnNvcyBzZXJ2aWNpb3MgcHJvdmlzdG9zIHBvciBsYSBVbml2ZXJzaWRhZCwgY3JlYWRvcyBvIHBvciBjcmVhcnNlLCB0YWxlcyBjb21vIGVsIFJlcG9zaXRvcmlvIERpZ2l0YWwgZGUgVGVzaXMgUFVDUCwgQ29sZWNjacOzbiBkZSBUZXNpcywgZW50cmUgb3Ryb3MsIGVuIGVsIFBlcsO6IHkgZW4gZWwgZXh0cmFuamVybywKcG9yIGVsIHRpZW1wbyB5IHZlY2VzIHF1ZSBjb25zaWRlcmUgbmVjZXNhcmlhcywgeSBsaWJyZSBkZSByZW11bmVyYWNpb25lcy4KRW4gdmlydHVkIGRlIGRpY2hhIGxpY2VuY2lhLCBsYSBQb250aWZpY2lhIFVuaXZlcnNpZGFkIENhdMOzbGljYSBkZWwgUGVyw7ogcG9kcsOhIHJlcHJvZHVjaXIgbWkgdGVzaXMgZW4gY3VhbHF1aWVyIHRpcG8gZGUgc29wb3J0ZSB5IGVuIG3DoXMgZGUgdW4gZWplbXBsYXIsIHNpbiBtb2RpZmljYXIgc3UgY29udGVuaWRvLCBzb2xvIGNvbgpwcm9ww7NzaXRvcyBkZSBzZWd1cmlkYWQsIHJlc3BhbGRvIHkgcHJlc2VydmFjacOzbi4gCkRlY2xhcm8gcXVlIGxhIHRlc2lzIGVzIHVuYSBjcmVhY2nDs24gZGUgbWkgYXV0b3LDrWEgeSBleGNsdXNpdmEgdGl0dWxhcmlkYWQsIG8gY29hdXRvcsOtYSBjb24gdGl0dWxhcmlkYWQgY29tcGFydGlkYSwgeSBtZSBlbmN1ZW50cm8gZmFjdWx0YWRvIGEgY29uY2VkZXIgbGEgcHJlc2VudGUgbGljZW5jaWEgeSwgYXNpbWlzbW8sCmdhcmFudGl6byBxdWUgZGljaGEgdGVzaXMgbm8gaW5mcmluZ2UgZGVyZWNob3MgZGUgYXV0b3IgZGUgdGVyY2VyYXMgcGVyc29uYXMuCkxhIFBvbnRpZmljaWEgVW5pdmVyc2lkYWQgQ2F0w7NsaWNhIGRlbCBQZXLDuiBjb25zaWduYXLDoSBlbCBub21icmUgZGVsL2xvcyBhdXRvci9lcyBkZSBsYSB0ZXNpcywgeSBubyBsZSBoYXLDoSBuaW5ndW5hIG1vZGlmaWNhY2nDs24gbcOhcyBxdWUgbGEgcGVybWl0aWRhIGVuIGxhIHByZXNlbnRlIGxpY2VuY2lhLgo= |
| score |
13.422088 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).