Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural

Descripción del Articulo

La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento...

Descripción completa

Detalles Bibliográficos
Autor: Cornejo Aparicio, Víctor Manuel
Formato: tesis doctoral
Fecha de Publicación:2013
Institución:Consejo Nacional de Ciencia Tecnología e Innovación
Repositorio:CONCYTEC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.concytec.gob.pe:20.500.12390/352
Enlace del recurso:https://hdl.handle.net/20.500.12390/352
Nivel de acceso:acceso abierto
Materia:Semántica
Lenguaje natural
Reuters
https://purl.org/pe-repo/ocde/ford#1.02.01
id CONC_4aaa2fee42835deac0a29a6f4daf258b
oai_identifier_str oai:repositorio.concytec.gob.pe:20.500.12390/352
network_acronym_str CONC
network_name_str CONCYTEC-Institucional
repository_id_str 4689
dc.title.none.fl_str_mv Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
spellingShingle Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
Cornejo Aparicio, Víctor Manuel
Semántica
Lenguaje natural
Reuters
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_full Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_fullStr Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_full_unstemmed Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
title_sort Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
author Cornejo Aparicio, Víctor Manuel
author_facet Cornejo Aparicio, Víctor Manuel
author_role author
dc.contributor.author.fl_str_mv Cornejo Aparicio, Víctor Manuel
dc.subject.none.fl_str_mv Semántica
topic Semántica
Lenguaje natural
Reuters
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.es_PE.fl_str_mv Lenguaje natural
Reuters
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.
publishDate 2013
dc.date.accessioned.none.fl_str_mv 2024-05-30T23:13:38Z
dc.date.available.none.fl_str_mv 2024-05-30T23:13:38Z
dc.date.issued.fl_str_mv 2013
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12390/352
url https://hdl.handle.net/20.500.12390/352
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.publisher.none.fl_str_mv Universidad Nacional de San Agustín
publisher.none.fl_str_mv Universidad Nacional de San Agustín
dc.source.none.fl_str_mv reponame:CONCYTEC-Institucional
instname:Consejo Nacional de Ciencia Tecnología e Innovación
instacron:CONCYTEC
instname_str Consejo Nacional de Ciencia Tecnología e Innovación
instacron_str CONCYTEC
institution CONCYTEC
reponame_str CONCYTEC-Institucional
collection CONCYTEC-Institucional
bitstream.url.fl_str_mv https://repositorio.concytec.gob.pe/bitstreams/9db7dcfe-0ddf-e414-5816-e4ef62a62025/download
https://repositorio.concytec.gob.pe/bitstreams/1d5f2726-c589-9e31-b2eb-fb2804dbdebd/download
https://repositorio.concytec.gob.pe/bitstreams/542abfd1-94a6-5070-4e31-a3f0bc5b512a/download
https://repositorio.concytec.gob.pe/bitstreams/a81d2a3a-9eff-205a-bb83-52a9d1b0de99/download
https://repositorio.concytec.gob.pe/bitstreams/93343faf-3019-45bb-8ac3-0c8fd6143374/download
bitstream.checksum.fl_str_mv 683d9883b2ad62ac3b8bafc566b2e600
e112f453a8b8a0a74f28f0820d5e2161
49b3f191ea2d01d49d0e0eeea2211b5e
8a4605be74aa9ea9d79846c1fba20a33
42c8ccb74550dceffdafcf3258bde7be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional CONCYTEC
repository.mail.fl_str_mv repositorio@concytec.gob.pe
_version_ 1844883040270024704
spelling Publicationrp00316600Cornejo Aparicio, Víctor Manuel2024-05-30T23:13:38Z2024-05-30T23:13:38Z2013https://hdl.handle.net/20.500.12390/352La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.Fondo Nacional de Desarrollo Científico y Tecnológico - FondecytspaUniversidad Nacional de San Agustíninfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/4.0/SemánticaLenguaje natural-1Reuters-1https://purl.org/pe-repo/ocde/ford#1.02.01-1Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje naturalinfo:eu-repo/semantics/doctoralThesisreponame:CONCYTEC-Institucionalinstname:Consejo Nacional de Ciencia Tecnología e Innovacióninstacron:CONCYTEC#PLACEHOLDER_PARENT_METADATA_VALUE#Doctor en Ciencias de la ComputaciónComputación y Ciencias de la InformaciónUniversidad Nacional de San Agustín de Arequipa. Escuela de PostgradoCC-LICENSElicense_textlicense_texttext/html; charset=utf-821328https://repositorio.concytec.gob.pe/bitstreams/9db7dcfe-0ddf-e414-5816-e4ef62a62025/download683d9883b2ad62ac3b8bafc566b2e600MD53ORIGINAL2013_Cornejo_Construcción-automática.pdf2013_Cornejo_Construcción-automática.pdfapplication/pdf2085794https://repositorio.concytec.gob.pe/bitstreams/1d5f2726-c589-9e31-b2eb-fb2804dbdebd/downloade112f453a8b8a0a74f28f0820d5e2161MD51THUMBNAIL2013_Cornejo_Construcción-automática.pdf.jpg2013_Cornejo_Construcción-automática.pdf.jpgIM Thumbnailimage/jpeg7601https://repositorio.concytec.gob.pe/bitstreams/542abfd1-94a6-5070-4e31-a3f0bc5b512a/download49b3f191ea2d01d49d0e0eeea2211b5eMD56LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.concytec.gob.pe/bitstreams/a81d2a3a-9eff-205a-bb83-52a9d1b0de99/download8a4605be74aa9ea9d79846c1fba20a33MD55TEXT2013_Cornejo_Construcción-automática.pdf.txt2013_Cornejo_Construcción-automática.pdf.txtExtracted texttext/plain237098https://repositorio.concytec.gob.pe/bitstreams/93343faf-3019-45bb-8ac3-0c8fd6143374/download42c8ccb74550dceffdafcf3258bde7beMD5720.500.12390/352oai:repositorio.concytec.gob.pe:20.500.12390/3522024-06-10 15:19:22.587http://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessopen accesshttps://repositorio.concytec.gob.peRepositorio Institucional CONCYTECrepositorio@concytec.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=#PLACEHOLDER_PARENT_METADATA_VALUE#<Publication xmlns="https://www.openaire.eu/cerif-profile/1.1/" id="dfb3f293-4897-411d-94f0-4fc66f023b3c"> <Type xmlns="https://www.openaire.eu/cerif-profile/vocab/COAR_Publication_Types">http://purl.org/coar/resource_type/c_1843</Type> <Language>spa</Language> <Title>Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural</Title> <PublishedIn> <Publication> </Publication> </PublishedIn> <PublicationDate>2013</PublicationDate> <Authors> <Author> <DisplayName>Cornejo Aparicio, Víctor Manuel</DisplayName> <Person id="rp00316" /> <Affiliation> <OrgUnit> </OrgUnit> </Affiliation> </Author> </Authors> <Editors> </Editors> <Publishers> <Publisher> <DisplayName>Universidad Nacional de San Agustín</DisplayName> <OrgUnit /> </Publisher> </Publishers> <License>http://creativecommons.org/licenses/by-nc/4.0/</License> <Keyword>Semántica</Keyword> <Keyword>Lenguaje natural</Keyword> <Keyword>Reuters</Keyword> <Abstract>La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.</Abstract> <Access xmlns="http://purl.org/coar/access_right" > </Access> </Publication> -1
score 13.377223
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).