Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo

Descripción del Articulo

La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy...

Descripción completa

Detalles Bibliográficos
Autor: Ego Aguirre Santa Cruz, Renzo Alberto
Formato: tesis de maestría
Fecha de Publicación:2018
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/12978
Enlace del recurso:http://hdl.handle.net/20.500.12404/12978
Nivel de acceso:acceso abierto
Materia:Traducción automática--Lenguas indígenas
Traductores--Shipibo-Conibo
Shipibo-Conibo--Morfología
https://purl.org/pe-repo/ocde/ford#6.02.06
id PUCP_acad8971805a323e3f91cb1d6b25d808
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/12978
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
title Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
spellingShingle Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
Ego Aguirre Santa Cruz, Renzo Alberto
Traducción automática--Lenguas indígenas
Traductores--Shipibo-Conibo
Shipibo-Conibo--Morfología
https://purl.org/pe-repo/ocde/ford#6.02.06
title_short Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
title_full Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
title_fullStr Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
title_full_unstemmed Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
title_sort Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
author Ego Aguirre Santa Cruz, Renzo Alberto
author_facet Ego Aguirre Santa Cruz, Renzo Alberto
author_role author
dc.contributor.advisor.fl_str_mv Zariquiey Biondi, Roberto Daniel
dc.contributor.author.fl_str_mv Ego Aguirre Santa Cruz, Renzo Alberto
dc.subject.es_ES.fl_str_mv Traducción automática--Lenguas indígenas
Traductores--Shipibo-Conibo
Shipibo-Conibo--Morfología
topic Traducción automática--Lenguas indígenas
Traductores--Shipibo-Conibo
Shipibo-Conibo--Morfología
https://purl.org/pe-repo/ocde/ford#6.02.06
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#6.02.06
description La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo de seis significados diferentes. Para abordar la complejidad que supone esta forma lingüística, la presente tesis se centra principalmente en la creación de un algoritmo que desambigüe los distintos valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la creación de un software de traducción automática basado en estadística requiere el uso de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de métodos de traducción automática basados en reglas. En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta prioriza, en una primera instancia, la desambiguación de las funciones más morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se argumenta en este trabajo de investigación, son más fáciles de procesar por un software de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta constituye una estrategia potencialmente repicable para la desambiguación de morfemas polifuncionales en el marco de proyectos de traducción automática que trabajen con otras lenguas minoritarias.
publishDate 2018
dc.date.accessioned.es_ES.fl_str_mv 2018-11-12T20:41:36Z
dc.date.available.es_ES.fl_str_mv 2018-11-12T20:41:36Z
dc.date.created.es_ES.fl_str_mv 2018
dc.date.EmbargoEnd.none.fl_str_mv 2018-11-26
dc.date.issued.fl_str_mv 2018-11-12
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/12978
url http://hdl.handle.net/20.500.12404/12978
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/4294fa09-4d7a-4acd-a88b-8f482615e6cf/download
https://tesis.pucp.edu.pe/bitstreams/6a6d629c-3845-4719-bf0b-6f616e178b98/download
https://tesis.pucp.edu.pe/bitstreams/d96832df-0987-45bc-b998-f59342925436/download
https://tesis.pucp.edu.pe/bitstreams/5c3ee513-bab9-4df7-98ba-fad52282d07e/download
https://tesis.pucp.edu.pe/bitstreams/0487b1a4-d6df-476d-9446-3f3ce6183deb/download
https://tesis.pucp.edu.pe/bitstreams/c4ddd663-e9de-44ef-841d-4146d57ce2ce/download
bitstream.checksum.fl_str_mv df4a704fcef23b4c6c34b6542225a18f
1b553aad5c84669f529b34c9719e2629
27aebf468cd68dc7eda8cba25fc5f3a8
8a4605be74aa9ea9d79846c1fba20a33
0b920d325f025ebd0ef974dbc45ecbaa
933f73e9f8fe8c6ab3a23c6e14bc255e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1839176350532894720
spelling Zariquiey Biondi, Roberto DanielEgo Aguirre Santa Cruz, Renzo Alberto2018-11-12T20:41:36Z2018-11-12T20:41:36Z20182018-11-122018-11-26http://hdl.handle.net/20.500.12404/12978La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo de seis significados diferentes. Para abordar la complejidad que supone esta forma lingüística, la presente tesis se centra principalmente en la creación de un algoritmo que desambigüe los distintos valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la creación de un software de traducción automática basado en estadística requiere el uso de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de métodos de traducción automática basados en reglas. En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta prioriza, en una primera instancia, la desambiguación de las funciones más morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se argumenta en este trabajo de investigación, son más fáciles de procesar por un software de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta constituye una estrategia potencialmente repicable para la desambiguación de morfemas polifuncionales en el marco de proyectos de traducción automática que trabajen con otras lenguas minoritarias.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Traducción automática--Lenguas indígenasTraductores--Shipibo-ConiboShipibo-Conibo--Morfologíahttps://purl.org/pe-repo/ocde/ford#6.02.06Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-koniboinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en LingüísticaMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoLingüística232137https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdfEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdfTexto completoapplication/pdf2209102https://tesis.pucp.edu.pe/bitstreams/4294fa09-4d7a-4acd-a88b-8f482615e6cf/downloaddf4a704fcef23b4c6c34b6542225a18fMD55trueAnonymousREADTEXTEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.txtEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.txtExtracted texttext/plain185780https://tesis.pucp.edu.pe/bitstreams/6a6d629c-3845-4719-bf0b-6f616e178b98/download1b553aad5c84669f529b34c9719e2629MD57falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://tesis.pucp.edu.pe/bitstreams/d96832df-0987-45bc-b998-f59342925436/download27aebf468cd68dc7eda8cba25fc5f3a8MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/5c3ee513-bab9-4df7-98ba-fad52282d07e/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILEGO AGUIRRE_SANTA CRUZ_DESAMBIGUACION_DE_MORFEMAS_POLIFUNCIONALES_EN_LA_TRADUCCION_AUTOMATICA_DE_LENGUA_MINORITARIAS.pdf.jpgEGO AGUIRRE_SANTA CRUZ_DESAMBIGUACION_DE_MORFEMAS_POLIFUNCIONALES_EN_LA_TRADUCCION_AUTOMATICA_DE_LENGUA_MINORITARIAS.pdf.jpgIM Thumbnailimage/jpeg16830https://tesis.pucp.edu.pe/bitstreams/0487b1a4-d6df-476d-9446-3f3ce6183deb/download0b920d325f025ebd0ef974dbc45ecbaaMD54falseAnonymousREADEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.jpgEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.jpgIM Thumbnailimage/jpeg15419https://tesis.pucp.edu.pe/bitstreams/c4ddd663-e9de-44ef-841d-4146d57ce2ce/download933f73e9f8fe8c6ab3a23c6e14bc255eMD56falseAnonymousREAD20.500.12404/12978oai:tesis.pucp.edu.pe:20.500.12404/129782025-07-18 12:43:20.599http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.4481325
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).