Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural

Descripción del Articulo

La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento...

Descripción completa

Detalles Bibliográficos
Autor: Cornejo Aparicio, Víctor Manuel
Formato: tesis doctoral
Fecha de Publicación:2013
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:UNSA/7340
Enlace del recurso:http://repositorio.unsa.edu.pe/handle/UNSA/7340
Nivel de acceso:acceso abierto
Materia:Clasificación
Reuters
Lenguaje natural
https://purl.org/pe-repo/ocde/ford#2.02.03
id UNSA_4ad8bfb37b69e245033f1e6415aff867
oai_identifier_str oai:repositorio.unsa.edu.pe:UNSA/7340
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
spelling Tejada Cárcamo, JavierCornejo Aparicio, Víctor Manuel2018-12-28T12:19:43Z2018-12-28T12:19:43Z2013La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.Tesisapplication/pdfhttp://repositorio.unsa.edu.pe/handle/UNSA/7340spaUniversidad Nacional de San Agustín de Arequipainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAClasificaciónReutersLenguaje naturalhttps://purl.org/pe-repo/ocde/ford#2.02.03Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje naturalinfo:eu-repo/semantics/doctoralThesisSUNEDUDoctorado en Ciencias de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosDoctoradoDoctor en Ciencias de la ComputaciónORIGINALISDcoapvm.pdfapplication/pdf2141008https://repositorio.unsa.edu.pe/bitstreams/23d5f389-bfeb-4276-aa3a-b7174babcc92/downloadd131a9baed86ba25b3181703ae9a1b47MD51TEXTISDcoapvm.pdf.txtISDcoapvm.pdf.txtExtracted texttext/plain237549https://repositorio.unsa.edu.pe/bitstreams/aec080c5-001f-4c84-a392-f27d7c4c7ec6/download2ec0b3d4a4b2a5fdc239509acb4cb2d9MD52UNSA/7340oai:repositorio.unsa.edu.pe:UNSA/73402022-05-29 11:32:51.495http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe
dc.title.es_PE.fl_str_mv Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
spellingShingle Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
Cornejo Aparicio, Víctor Manuel
Clasificación
Reuters
Lenguaje natural
https://purl.org/pe-repo/ocde/ford#2.02.03
title_short Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_full Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_fullStr Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_full_unstemmed Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_sort Construcción automática y análisis de Modelos de Espacios de Palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
author Cornejo Aparicio, Víctor Manuel
author_facet Cornejo Aparicio, Víctor Manuel
author_role author
dc.contributor.advisor.fl_str_mv Tejada Cárcamo, Javier
dc.contributor.author.fl_str_mv Cornejo Aparicio, Víctor Manuel
dc.subject.es_PE.fl_str_mv Clasificación
Reuters
Lenguaje natural
topic Clasificación
Reuters
Lenguaje natural
https://purl.org/pe-repo/ocde/ford#2.02.03
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.03
description La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.
publishDate 2013
dc.date.accessioned.none.fl_str_mv 2018-12-28T12:19:43Z
dc.date.available.none.fl_str_mv 2018-12-28T12:19:43Z
dc.date.issued.fl_str_mv 2013
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unsa.edu.pe/handle/UNSA/7340
url http://repositorio.unsa.edu.pe/handle/UNSA/7340
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/23d5f389-bfeb-4276-aa3a-b7174babcc92/download
https://repositorio.unsa.edu.pe/bitstreams/aec080c5-001f-4c84-a392-f27d7c4c7ec6/download
bitstream.checksum.fl_str_mv d131a9baed86ba25b3181703ae9a1b47
2ec0b3d4a4b2a5fdc239509acb4cb2d9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828763169908064256
score 13.887739
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).