Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
Descripción del Articulo
La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2018 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/12978 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/12978 |
Nivel de acceso: | acceso abierto |
Materia: | Traducción automática--Lenguas indígenas Traductores--Shipibo-Conibo Shipibo-Conibo--Morfología https://purl.org/pe-repo/ocde/ford#6.02.06 |
id |
PUCP_acad8971805a323e3f91cb1d6b25d808 |
---|---|
oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/12978 |
network_acronym_str |
PUCP |
network_name_str |
PUCP-Tesis |
repository_id_str |
. |
dc.title.es_ES.fl_str_mv |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
title |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
spellingShingle |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo Ego Aguirre Santa Cruz, Renzo Alberto Traducción automática--Lenguas indígenas Traductores--Shipibo-Conibo Shipibo-Conibo--Morfología https://purl.org/pe-repo/ocde/ford#6.02.06 |
title_short |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
title_full |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
title_fullStr |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
title_full_unstemmed |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
title_sort |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo |
author |
Ego Aguirre Santa Cruz, Renzo Alberto |
author_facet |
Ego Aguirre Santa Cruz, Renzo Alberto |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Zariquiey Biondi, Roberto Daniel |
dc.contributor.author.fl_str_mv |
Ego Aguirre Santa Cruz, Renzo Alberto |
dc.subject.es_ES.fl_str_mv |
Traducción automática--Lenguas indígenas Traductores--Shipibo-Conibo Shipibo-Conibo--Morfología |
topic |
Traducción automática--Lenguas indígenas Traductores--Shipibo-Conibo Shipibo-Conibo--Morfología https://purl.org/pe-repo/ocde/ford#6.02.06 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#6.02.06 |
description |
La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo de seis significados diferentes. Para abordar la complejidad que supone esta forma lingüística, la presente tesis se centra principalmente en la creación de un algoritmo que desambigüe los distintos valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la creación de un software de traducción automática basado en estadística requiere el uso de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de métodos de traducción automática basados en reglas. En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta prioriza, en una primera instancia, la desambiguación de las funciones más morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se argumenta en este trabajo de investigación, son más fáciles de procesar por un software de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta constituye una estrategia potencialmente repicable para la desambiguación de morfemas polifuncionales en el marco de proyectos de traducción automática que trabajen con otras lenguas minoritarias. |
publishDate |
2018 |
dc.date.accessioned.es_ES.fl_str_mv |
2018-11-12T20:41:36Z |
dc.date.available.es_ES.fl_str_mv |
2018-11-12T20:41:36Z |
dc.date.created.es_ES.fl_str_mv |
2018 |
dc.date.EmbargoEnd.none.fl_str_mv |
2018-11-26 |
dc.date.issued.fl_str_mv |
2018-11-12 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/12978 |
url |
http://hdl.handle.net/20.500.12404/12978 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Tesis |
collection |
PUCP-Tesis |
bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/4294fa09-4d7a-4acd-a88b-8f482615e6cf/download https://tesis.pucp.edu.pe/bitstreams/6a6d629c-3845-4719-bf0b-6f616e178b98/download https://tesis.pucp.edu.pe/bitstreams/d96832df-0987-45bc-b998-f59342925436/download https://tesis.pucp.edu.pe/bitstreams/5c3ee513-bab9-4df7-98ba-fad52282d07e/download https://tesis.pucp.edu.pe/bitstreams/0487b1a4-d6df-476d-9446-3f3ce6183deb/download https://tesis.pucp.edu.pe/bitstreams/c4ddd663-e9de-44ef-841d-4146d57ce2ce/download |
bitstream.checksum.fl_str_mv |
df4a704fcef23b4c6c34b6542225a18f 1b553aad5c84669f529b34c9719e2629 27aebf468cd68dc7eda8cba25fc5f3a8 8a4605be74aa9ea9d79846c1fba20a33 0b920d325f025ebd0ef974dbc45ecbaa 933f73e9f8fe8c6ab3a23c6e14bc255e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
_version_ |
1839176350532894720 |
spelling |
Zariquiey Biondi, Roberto DanielEgo Aguirre Santa Cruz, Renzo Alberto2018-11-12T20:41:36Z2018-11-12T20:41:36Z20182018-11-122018-11-26http://hdl.handle.net/20.500.12404/12978La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo de seis significados diferentes. Para abordar la complejidad que supone esta forma lingüística, la presente tesis se centra principalmente en la creación de un algoritmo que desambigüe los distintos valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la creación de un software de traducción automática basado en estadística requiere el uso de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de métodos de traducción automática basados en reglas. En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta prioriza, en una primera instancia, la desambiguación de las funciones más morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se argumenta en este trabajo de investigación, son más fáciles de procesar por un software de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta constituye una estrategia potencialmente repicable para la desambiguación de morfemas polifuncionales en el marco de proyectos de traducción automática que trabajen con otras lenguas minoritarias.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Traducción automática--Lenguas indígenasTraductores--Shipibo-ConiboShipibo-Conibo--Morfologíahttps://purl.org/pe-repo/ocde/ford#6.02.06Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-koniboinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en LingüísticaMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoLingüística232137https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdfEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdfTexto completoapplication/pdf2209102https://tesis.pucp.edu.pe/bitstreams/4294fa09-4d7a-4acd-a88b-8f482615e6cf/downloaddf4a704fcef23b4c6c34b6542225a18fMD55trueAnonymousREADTEXTEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.txtEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.txtExtracted texttext/plain185780https://tesis.pucp.edu.pe/bitstreams/6a6d629c-3845-4719-bf0b-6f616e178b98/download1b553aad5c84669f529b34c9719e2629MD57falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://tesis.pucp.edu.pe/bitstreams/d96832df-0987-45bc-b998-f59342925436/download27aebf468cd68dc7eda8cba25fc5f3a8MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/5c3ee513-bab9-4df7-98ba-fad52282d07e/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILEGO AGUIRRE_SANTA CRUZ_DESAMBIGUACION_DE_MORFEMAS_POLIFUNCIONALES_EN_LA_TRADUCCION_AUTOMATICA_DE_LENGUA_MINORITARIAS.pdf.jpgEGO AGUIRRE_SANTA CRUZ_DESAMBIGUACION_DE_MORFEMAS_POLIFUNCIONALES_EN_LA_TRADUCCION_AUTOMATICA_DE_LENGUA_MINORITARIAS.pdf.jpgIM Thumbnailimage/jpeg16830https://tesis.pucp.edu.pe/bitstreams/0487b1a4-d6df-476d-9446-3f3ce6183deb/download0b920d325f025ebd0ef974dbc45ecbaaMD54falseAnonymousREADEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.jpgEGO_AGUIRRE_DESAMBIGUACION_MORFEMAS.pdf.jpgIM Thumbnailimage/jpeg15419https://tesis.pucp.edu.pe/bitstreams/c4ddd663-e9de-44ef-841d-4146d57ce2ce/download933f73e9f8fe8c6ab3a23c6e14bc255eMD56falseAnonymousREAD20.500.12404/12978oai:tesis.pucp.edu.pe:20.500.12404/129782025-07-18 12:43:20.599http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.4481325 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).