Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural
Descripción del Articulo
La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2013 |
| Institución: | Consejo Nacional de Ciencia Tecnología e Innovación |
| Repositorio: | CONCYTEC-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.concytec.gob.pe:20.500.12390/352 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12390/352 |
| Nivel de acceso: | acceso abierto |
| Materia: | Semántica Lenguaje natural Reuters https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
CONC_4aaa2fee42835deac0a29a6f4daf258b |
|---|---|
| oai_identifier_str |
oai:repositorio.concytec.gob.pe:20.500.12390/352 |
| network_acronym_str |
CONC |
| network_name_str |
CONCYTEC-Institucional |
| repository_id_str |
4689 |
| dc.title.none.fl_str_mv |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| title |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| spellingShingle |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural Cornejo Aparicio, Víctor Manuel Semántica Lenguaje natural Reuters https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| title_full |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| title_fullStr |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| title_full_unstemmed |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| title_sort |
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural |
| author |
Cornejo Aparicio, Víctor Manuel |
| author_facet |
Cornejo Aparicio, Víctor Manuel |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Cornejo Aparicio, Víctor Manuel |
| dc.subject.none.fl_str_mv |
Semántica |
| topic |
Semántica Lenguaje natural Reuters https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.es_PE.fl_str_mv |
Lenguaje natural Reuters |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta. |
| publishDate |
2013 |
| dc.date.accessioned.none.fl_str_mv |
2024-05-30T23:13:38Z |
| dc.date.available.none.fl_str_mv |
2024-05-30T23:13:38Z |
| dc.date.issued.fl_str_mv |
2013 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12390/352 |
| url |
https://hdl.handle.net/20.500.12390/352 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
| dc.publisher.none.fl_str_mv |
Universidad Nacional de San Agustín |
| publisher.none.fl_str_mv |
Universidad Nacional de San Agustín |
| dc.source.none.fl_str_mv |
reponame:CONCYTEC-Institucional instname:Consejo Nacional de Ciencia Tecnología e Innovación instacron:CONCYTEC |
| instname_str |
Consejo Nacional de Ciencia Tecnología e Innovación |
| instacron_str |
CONCYTEC |
| institution |
CONCYTEC |
| reponame_str |
CONCYTEC-Institucional |
| collection |
CONCYTEC-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.concytec.gob.pe/bitstreams/9db7dcfe-0ddf-e414-5816-e4ef62a62025/download https://repositorio.concytec.gob.pe/bitstreams/1d5f2726-c589-9e31-b2eb-fb2804dbdebd/download https://repositorio.concytec.gob.pe/bitstreams/542abfd1-94a6-5070-4e31-a3f0bc5b512a/download https://repositorio.concytec.gob.pe/bitstreams/a81d2a3a-9eff-205a-bb83-52a9d1b0de99/download https://repositorio.concytec.gob.pe/bitstreams/93343faf-3019-45bb-8ac3-0c8fd6143374/download |
| bitstream.checksum.fl_str_mv |
683d9883b2ad62ac3b8bafc566b2e600 e112f453a8b8a0a74f28f0820d5e2161 49b3f191ea2d01d49d0e0eeea2211b5e 8a4605be74aa9ea9d79846c1fba20a33 42c8ccb74550dceffdafcf3258bde7be |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional CONCYTEC |
| repository.mail.fl_str_mv |
repositorio@concytec.gob.pe |
| _version_ |
1844883040270024704 |
| spelling |
Publicationrp00316600Cornejo Aparicio, Víctor Manuel2024-05-30T23:13:38Z2024-05-30T23:13:38Z2013https://hdl.handle.net/20.500.12390/352La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.Fondo Nacional de Desarrollo Científico y Tecnológico - FondecytspaUniversidad Nacional de San Agustíninfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/4.0/SemánticaLenguaje natural-1Reuters-1https://purl.org/pe-repo/ocde/ford#1.02.01-1Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje naturalinfo:eu-repo/semantics/doctoralThesisreponame:CONCYTEC-Institucionalinstname:Consejo Nacional de Ciencia Tecnología e Innovacióninstacron:CONCYTEC#PLACEHOLDER_PARENT_METADATA_VALUE#Doctor en Ciencias de la ComputaciónComputación y Ciencias de la InformaciónUniversidad Nacional de San Agustín de Arequipa. Escuela de PostgradoCC-LICENSElicense_textlicense_texttext/html; charset=utf-821328https://repositorio.concytec.gob.pe/bitstreams/9db7dcfe-0ddf-e414-5816-e4ef62a62025/download683d9883b2ad62ac3b8bafc566b2e600MD53ORIGINAL2013_Cornejo_Construcción-automática.pdf2013_Cornejo_Construcción-automática.pdfapplication/pdf2085794https://repositorio.concytec.gob.pe/bitstreams/1d5f2726-c589-9e31-b2eb-fb2804dbdebd/downloade112f453a8b8a0a74f28f0820d5e2161MD51THUMBNAIL2013_Cornejo_Construcción-automática.pdf.jpg2013_Cornejo_Construcción-automática.pdf.jpgIM Thumbnailimage/jpeg7601https://repositorio.concytec.gob.pe/bitstreams/542abfd1-94a6-5070-4e31-a3f0bc5b512a/download49b3f191ea2d01d49d0e0eeea2211b5eMD56LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.concytec.gob.pe/bitstreams/a81d2a3a-9eff-205a-bb83-52a9d1b0de99/download8a4605be74aa9ea9d79846c1fba20a33MD55TEXT2013_Cornejo_Construcción-automática.pdf.txt2013_Cornejo_Construcción-automática.pdf.txtExtracted texttext/plain237098https://repositorio.concytec.gob.pe/bitstreams/93343faf-3019-45bb-8ac3-0c8fd6143374/download42c8ccb74550dceffdafcf3258bde7beMD5720.500.12390/352oai:repositorio.concytec.gob.pe:20.500.12390/3522024-06-10 15:19:22.587http://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessopen accesshttps://repositorio.concytec.gob.peRepositorio Institucional CONCYTECrepositorio@concytec.gob.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=#PLACEHOLDER_PARENT_METADATA_VALUE#<Publication xmlns="https://www.openaire.eu/cerif-profile/1.1/" id="dfb3f293-4897-411d-94f0-4fc66f023b3c"> <Type xmlns="https://www.openaire.eu/cerif-profile/vocab/COAR_Publication_Types">http://purl.org/coar/resource_type/c_1843</Type> <Language>spa</Language> <Title>Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural</Title> <PublishedIn> <Publication> </Publication> </PublishedIn> <PublicationDate>2013</PublicationDate> <Authors> <Author> <DisplayName>Cornejo Aparicio, Víctor Manuel</DisplayName> <Person id="rp00316" /> <Affiliation> <OrgUnit> </OrgUnit> </Affiliation> </Author> </Authors> <Editors> </Editors> <Publishers> <Publisher> <DisplayName>Universidad Nacional de San Agustín</DisplayName> <OrgUnit /> </Publisher> </Publishers> <License>http://creativecommons.org/licenses/by-nc/4.0/</License> <Keyword>Semántica</Keyword> <Keyword>Lenguaje natural</Keyword> <Keyword>Reuters</Keyword> <Abstract>La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.</Abstract> <Access xmlns="http://purl.org/coar/access_right" > </Access> </Publication> -1 |
| score |
13.377223 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).