Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo

Descripción del Articulo

Este proyecto tiene como objetivo el desarrollo de una base de datos léxica basada en sinonimia (mejor conocida como WordNet) para la lengua Shipibo-Konibo. Se trabajó con el fin de generar recursos electrónicos para esta lengua que a pesar de ser la segunda más hablada en la amazonia posee escasos...

Descripción completa

Detalles Bibliográficos
Autor: Maguiño Valencia, Diego Arturo
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/182594
Enlace del recurso:http://hdl.handle.net/20.500.12404/20956
Nivel de acceso:acceso abierto
Materia:Lenguas indígenas--Perú
Shipibo-Conibo--Léxico
Lingüística computacional
Léxico--Bases de datos
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_c624f1f96a5e2df345be67bbe1db966d
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/182594
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Oncevay Marcos, Félix ArturoMaguiño Valencia, Diego Arturo2021-11-24T16:28:07Z2021-11-24T16:28:07Z20212021-11-24http://hdl.handle.net/20.500.12404/20956Este proyecto tiene como objetivo el desarrollo de una base de datos léxica basada en sinonimia (mejor conocida como WordNet) para la lengua Shipibo-Konibo. Se trabajó con el fin de generar recursos electrónicos para esta lengua que a pesar de ser la segunda más hablada en la amazonia posee escasos recursos lingüísticos. Se contó con el apoyo de lingüistas y un hablante nativo de Shipibo-Konibo durante el proceso de desarrollo y para la validación del mismo. Como base se usó un diccionario escaneado en Shipibo-Konibo y la WordNet en español disponible a través de Internet. Para que la lectura del diccionario fuera posible, se desarrolló un algoritmo con este fin, el cual separaba las palabras del diccionario y las guardaba de forma ordenada en una base de datos. Entre los datos guardados por cada término se encuentran sentidos, glosa en español, categoría gramatical y ejemplos de uso. Una vez que ya se disponía de la base de datos del diccionario, este se usó como entrada para el algoritmo de creación de la WordNet en Shipibo-Konibo. Este algoritmo consiste en tomar la glosa y ejemplos de uso de cada sentido de cada término del diccionario y compararla con todos los synsets de la WordNet en español para determinar con cual se encuentra más relacionado. Esto se calcula en base al modelo Word2Vec el cual es usado para agrupar palabras detectando similitudes en los vectores que las representan matemáticamente. Realizado el cálculo, está relación es guardada en una base de datos, una vez que se completa el algoritmo la base de datos resultante es la WordNet. También se implementó una interfaz web de consulta así hacer posible el acceso a cualquier usuario. Este recurso es muy útil para facilitar tareas como la desambiguación, extracción de información y traducción automática gracias a la flexibilidad en las búsquedas. Al tener un carácter multilingüe, la WordNet ayudará no solo a preservar sino también expandir el alcance y la posibilidad de integrar a la lengua con otras personas interesadasspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Lenguas indígenas--PerúShipibo-Conibo--LéxicoLingüística computacionalLéxico--Bases de datoshttps://purl.org/pe-repo/ocde/ford#1.02.00Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Koniboinfo:eu-repo/semantics/bachelorThesisTesis de licenciaturareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática46440101https://orcid.org/0000-0001-7675-620872397807612286Melgar Sasieta, Hector AndresOncevay Marcos, Felix ArturoBeltran Castañon, Cesar Armandohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis20.500.14657/182594oai:repositorio.pucp.edu.pe:20.500.14657/1825942024-07-08 09:15:17.63http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
title Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
spellingShingle Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
Maguiño Valencia, Diego Arturo
Lenguas indígenas--Perú
Shipibo-Conibo--Léxico
Lingüística computacional
Léxico--Bases de datos
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
title_full Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
title_fullStr Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
title_full_unstemmed Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
title_sort Desarrollo de una base de datos léxica basada en sinonimia para Shipibo-Konibo
author Maguiño Valencia, Diego Arturo
author_facet Maguiño Valencia, Diego Arturo
author_role author
dc.contributor.advisor.fl_str_mv Oncevay Marcos, Félix Arturo
dc.contributor.author.fl_str_mv Maguiño Valencia, Diego Arturo
dc.subject.es_ES.fl_str_mv Lenguas indígenas--Perú
Shipibo-Conibo--Léxico
Lingüística computacional
Léxico--Bases de datos
topic Lenguas indígenas--Perú
Shipibo-Conibo--Léxico
Lingüística computacional
Léxico--Bases de datos
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Este proyecto tiene como objetivo el desarrollo de una base de datos léxica basada en sinonimia (mejor conocida como WordNet) para la lengua Shipibo-Konibo. Se trabajó con el fin de generar recursos electrónicos para esta lengua que a pesar de ser la segunda más hablada en la amazonia posee escasos recursos lingüísticos. Se contó con el apoyo de lingüistas y un hablante nativo de Shipibo-Konibo durante el proceso de desarrollo y para la validación del mismo. Como base se usó un diccionario escaneado en Shipibo-Konibo y la WordNet en español disponible a través de Internet. Para que la lectura del diccionario fuera posible, se desarrolló un algoritmo con este fin, el cual separaba las palabras del diccionario y las guardaba de forma ordenada en una base de datos. Entre los datos guardados por cada término se encuentran sentidos, glosa en español, categoría gramatical y ejemplos de uso. Una vez que ya se disponía de la base de datos del diccionario, este se usó como entrada para el algoritmo de creación de la WordNet en Shipibo-Konibo. Este algoritmo consiste en tomar la glosa y ejemplos de uso de cada sentido de cada término del diccionario y compararla con todos los synsets de la WordNet en español para determinar con cual se encuentra más relacionado. Esto se calcula en base al modelo Word2Vec el cual es usado para agrupar palabras detectando similitudes en los vectores que las representan matemáticamente. Realizado el cálculo, está relación es guardada en una base de datos, una vez que se completa el algoritmo la base de datos resultante es la WordNet. También se implementó una interfaz web de consulta así hacer posible el acceso a cualquier usuario. Este recurso es muy útil para facilitar tareas como la desambiguación, extracción de información y traducción automática gracias a la flexibilidad en las búsquedas. Al tener un carácter multilingüe, la WordNet ayudará no solo a preservar sino también expandir el alcance y la posibilidad de integrar a la lengua con otras personas interesadas
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-11-24T16:28:07Z
dc.date.available.none.fl_str_mv 2021-11-24T16:28:07Z
dc.date.created.none.fl_str_mv 2021
dc.date.issued.fl_str_mv 2021-11-24
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.other.none.fl_str_mv Tesis de licenciatura
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/20956
url http://hdl.handle.net/20.500.12404/20956
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638689679540224
score 13.960013
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).