Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
Descripción del Articulo
La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento...
Autor: | |
---|---|
Formato: | tesis doctoral |
Fecha de Publicación: | 2013 |
Institución: | Universidad Nacional de San Agustín |
Repositorio: | UNSA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsa.edu.pe:UNSA/7340 |
Enlace del recurso: | http://repositorio.unsa.edu.pe/handle/UNSA/7340 |
Nivel de acceso: | acceso abierto |
Materia: | Clasificación Reuters Lenguaje natural https://purl.org/pe-repo/ocde/ford#2.02.03 |
id |
UNSA_4ad8bfb37b69e245033f1e6415aff867 |
---|---|
oai_identifier_str |
oai:repositorio.unsa.edu.pe:UNSA/7340 |
network_acronym_str |
UNSA |
network_name_str |
UNSA-Institucional |
repository_id_str |
4847 |
spelling |
Tejada Cárcamo, JavierCornejo Aparicio, Víctor Manuel2018-12-28T12:19:43Z2018-12-28T12:19:43Z2013La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.Tesisapplication/pdfhttp://repositorio.unsa.edu.pe/handle/UNSA/7340spaUniversidad Nacional de San Agustín de Arequipainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAClasificaciónReutersLenguaje naturalhttps://purl.org/pe-repo/ocde/ford#2.02.03Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje naturalinfo:eu-repo/semantics/doctoralThesisSUNEDUDoctorado en Ciencias de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosDoctoradoDoctor en Ciencias de la ComputaciónORIGINALISDcoapvm.pdfapplication/pdf2141008https://repositorio.unsa.edu.pe/bitstreams/23d5f389-bfeb-4276-aa3a-b7174babcc92/downloadd131a9baed86ba25b3181703ae9a1b47MD51TEXTISDcoapvm.pdf.txtISDcoapvm.pdf.txtExtracted texttext/plain237549https://repositorio.unsa.edu.pe/bitstreams/aec080c5-001f-4c84-a392-f27d7c4c7ec6/download2ec0b3d4a4b2a5fdc239509acb4cb2d9MD52UNSA/7340oai:repositorio.unsa.edu.pe:UNSA/73402022-05-29 11:32:51.495http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe |
dc.title.es_PE.fl_str_mv |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
title |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
spellingShingle |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural Cornejo Aparicio, Víctor Manuel Clasificación Reuters Lenguaje natural https://purl.org/pe-repo/ocde/ford#2.02.03 |
title_short |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
title_full |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
title_fullStr |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
title_full_unstemmed |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
title_sort |
Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
author |
Cornejo Aparicio, Víctor Manuel |
author_facet |
Cornejo Aparicio, Víctor Manuel |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Tejada Cárcamo, Javier |
dc.contributor.author.fl_str_mv |
Cornejo Aparicio, Víctor Manuel |
dc.subject.es_PE.fl_str_mv |
Clasificación Reuters Lenguaje natural |
topic |
Clasificación Reuters Lenguaje natural https://purl.org/pe-repo/ocde/ford#2.02.03 |
dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.03 |
description |
La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta. |
publishDate |
2013 |
dc.date.accessioned.none.fl_str_mv |
2018-12-28T12:19:43Z |
dc.date.available.none.fl_str_mv |
2018-12-28T12:19:43Z |
dc.date.issued.fl_str_mv |
2013 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
dc.identifier.uri.none.fl_str_mv |
http://repositorio.unsa.edu.pe/handle/UNSA/7340 |
url |
http://repositorio.unsa.edu.pe/handle/UNSA/7340 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
instname_str |
Universidad Nacional de San Agustín |
instacron_str |
UNSA |
institution |
UNSA |
reponame_str |
UNSA-Institucional |
collection |
UNSA-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/23d5f389-bfeb-4276-aa3a-b7174babcc92/download https://repositorio.unsa.edu.pe/bitstreams/aec080c5-001f-4c84-a392-f27d7c4c7ec6/download |
bitstream.checksum.fl_str_mv |
d131a9baed86ba25b3181703ae9a1b47 2ec0b3d4a4b2a5fdc239509acb4cb2d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional UNSA |
repository.mail.fl_str_mv |
repositorio@unsa.edu.pe |
_version_ |
1828763169908064256 |
score |
13.887739 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).