Representación vectorial de relación de hiponimia e hiperonimia en español
Descripción del Articulo
Actualmente, gracias a Internet y a la Web se dispone de información casi ilimitada, la cual está representada a nivel de textos en su mayoría. Así, dado que acceder a estos textos en su mayoría es de libre acceso, nace el interés por su manipulación de una manera automatizada para poder extraer inf...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2019 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/172447 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/16962 |
| Nivel de acceso: | acceso abierto |
| Materia: | Computación semántica Procesamiento de lenguaje natural (Computación) Enseñanza con ayuda de computadoras https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
RPUC_61d7adb6c401bf0064c1e834646c6329 |
|---|---|
| oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/172447 |
| network_acronym_str |
RPUC |
| network_name_str |
PUCP-Institucional |
| repository_id_str |
2905 |
| dc.title.es_ES.fl_str_mv |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| title |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| spellingShingle |
Representación vectorial de relación de hiponimia e hiperonimia en español Utia Deza, Jose Vicente Computación semántica Procesamiento de lenguaje natural (Computación) Enseñanza con ayuda de computadoras https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| title_full |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| title_fullStr |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| title_full_unstemmed |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| title_sort |
Representación vectorial de relación de hiponimia e hiperonimia en español |
| author |
Utia Deza, Jose Vicente |
| author_facet |
Utia Deza, Jose Vicente |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Oncevay Marcos, Felix Arturo |
| dc.contributor.author.fl_str_mv |
Utia Deza, Jose Vicente |
| dc.subject.es_ES.fl_str_mv |
Computación semántica Procesamiento de lenguaje natural (Computación) Enseñanza con ayuda de computadoras |
| topic |
Computación semántica Procesamiento de lenguaje natural (Computación) Enseñanza con ayuda de computadoras https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
Actualmente, gracias a Internet y a la Web se dispone de información casi ilimitada, la cual está representada a nivel de textos en su mayoría. Así, dado que acceder a estos textos en su mayoría es de libre acceso, nace el interés por su manipulación de una manera automatizada para poder extraer información que se considere relevante. El presente trabajo de investigación se ubica dentro de la detección automática de relaciones léxicas entre palabras, que son relaciones que se establecen entre los significados de las palabras tal como se consigna en el diccionario. En particular, se centra en la detección de relaciones de hiponimia e hiperonimia, debido a que éstas son relaciones de palabras en las que una de ellas engloba el significado de otra o viceversa, lo cual podría considerarse como categorización de palabras. Básicamente, el método propuesto se basa en la manipulación de una representación vectorial de palabras denominado Word Embeddings, para resaltar especialmente áquellas que tengan relación jerárquica, proceso que se realiza a partir de textos no estructurados. Tradicionalmente, los Word Embeddings son utilizados para tareas de analogía, es decir, para detectar relaciones de sinonimia, por lo que se considera un poco más complejo utilizar estos vectores para la detección de relaciones jerárquicas (hiperonimia e hiponimia), por consecuencia se proponen métodos adicionales para que, en conjunto con los Word Embeddings, se puedan obtener resultados eficientes al momento de detectar las relaciones entre distintos pares de palabras. |
| publishDate |
2019 |
| dc.date.created.none.fl_str_mv |
2019 |
| dc.date.accessioned.none.fl_str_mv |
2020-09-03T20:40:59Z |
| dc.date.available.none.fl_str_mv |
2020-09-03T20:40:59Z |
| dc.date.issued.fl_str_mv |
2020-09-03 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.other.none.fl_str_mv |
Tesis de maestría |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/16962 |
| url |
http://hdl.handle.net/20.500.12404/16962 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Institucional |
| collection |
PUCP-Institucional |
| repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
| repository.mail.fl_str_mv |
repositorio@pucp.pe |
| _version_ |
1835638437766496256 |
| spelling |
Oncevay Marcos, Felix ArturoUtia Deza, Jose Vicente2020-09-03T20:40:59Z2020-09-03T20:40:59Z20192020-09-03http://hdl.handle.net/20.500.12404/16962Actualmente, gracias a Internet y a la Web se dispone de información casi ilimitada, la cual está representada a nivel de textos en su mayoría. Así, dado que acceder a estos textos en su mayoría es de libre acceso, nace el interés por su manipulación de una manera automatizada para poder extraer información que se considere relevante. El presente trabajo de investigación se ubica dentro de la detección automática de relaciones léxicas entre palabras, que son relaciones que se establecen entre los significados de las palabras tal como se consigna en el diccionario. En particular, se centra en la detección de relaciones de hiponimia e hiperonimia, debido a que éstas son relaciones de palabras en las que una de ellas engloba el significado de otra o viceversa, lo cual podría considerarse como categorización de palabras. Básicamente, el método propuesto se basa en la manipulación de una representación vectorial de palabras denominado Word Embeddings, para resaltar especialmente áquellas que tengan relación jerárquica, proceso que se realiza a partir de textos no estructurados. Tradicionalmente, los Word Embeddings son utilizados para tareas de analogía, es decir, para detectar relaciones de sinonimia, por lo que se considera un poco más complejo utilizar estos vectores para la detección de relaciones jerárquicas (hiperonimia e hiponimia), por consecuencia se proponen métodos adicionales para que, en conjunto con los Word Embeddings, se puedan obtener resultados eficientes al momento de detectar las relaciones entre distintos pares de palabras.Currently, thanks to the Internet and Web, almost unlimited information is available, which is mostly represented at text level. Thus, given that access to these texts is mostly freely available, interest in their manipulation is born in an automated way to extract information that is considered relevant. The present research work is located within the automatic detection of lexical relations between words, which are relations that are established between the meanings of words as it is stated in the dictionary. In particular, it focuses on the detection of hyponymy and hyperonymy relationships, because these are word relationships in which one of them encompasses the meaning of another or vice versa, which could be considered as categorization of words. Basically, the proposed method is based on the manipulation of Word Embeddings to highlight especially words that have a hierarchical relationship, a process that is carried out from unstructured texts. Traditionally, Word Embeddings are used for analogy tasks, that is, to detect synonymy relationships, so it is considered a bit more complex to use these vectors for the hierarchical relationships (hyperonimia and hyponymy) detection, therefore, additional methods are proposed, so in conjunction with the Word Embeddings, efficient results can be obtained when detecting the relationships between different pairs of words.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Computación semánticaProcesamiento de lenguaje natural (Computación)Enseñanza con ayuda de computadorashttps://purl.org/pe-repo/ocde/ford#1.02.00Representación vectorial de relación de hiponimia e hiperonimia en españolinfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoInformática con mención en Ciencias de la Computación46440101611087https://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#tesis20.500.14657/172447oai:repositorio.pucp.edu.pe:20.500.14657/1724472024-06-10 10:10:36.239http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
| score |
13.999355 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).