Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave
Descripción del Articulo
Gracias a la World Wide Web la idea de información compartida alrededor del mundo es común para todos, la información es ingresada desde diferentes fuentes para que todos puedan verla y usarla. Una Smart Web o Semantic Web tiene como objetivo estructurar los contenidos de forma tal que todo esté rel...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2015 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/6050 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/6050 |
| Nivel de acceso: | acceso abierto |
| Materia: | Web semántica Inteligencia computacional Tecnología de la información Estructura de datos (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_c39c32280712f0976f91333682770450 |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/6050 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| title |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| spellingShingle |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave Vargas Rosales, Alfredo Adrián Web semántica Inteligencia computacional Tecnología de la información Estructura de datos (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| title_full |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| title_fullStr |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| title_full_unstemmed |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| title_sort |
Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos clave |
| author |
Vargas Rosales, Alfredo Adrián |
| author_facet |
Vargas Rosales, Alfredo Adrián |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Melgar Sasieta, Héctor Andrés |
| dc.contributor.author.fl_str_mv |
Vargas Rosales, Alfredo Adrián |
| dc.subject.es_ES.fl_str_mv |
Web semántica Inteligencia computacional Tecnología de la información Estructura de datos (Computación) |
| topic |
Web semántica Inteligencia computacional Tecnología de la información Estructura de datos (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
Gracias a la World Wide Web la idea de información compartida alrededor del mundo es común para todos, la información es ingresada desde diferentes fuentes para que todos puedan verla y usarla. Una Smart Web o Semantic Web tiene como objetivo estructurar los contenidos de forma tal que todo esté relacionado y por lo tanto, presente información consistente. Para ello, se requieren de estructuras que puedan ser accesadas por computadoras y contengan reglas de inferencia para un razonamiento automático. Una de estas estructuras es la ontología. Una ontología busca conceptualizar el conocimiento de un dominio específico valiéndose de representaciones. Como primer paso para construir una ontología, se debe obtener una taxonomía. Una taxonomía es una clasificación de entidades de información a manera de jerarquías. Las taxonomías ofrecen diversas ventajas como clasificar de la información, realizar búsquedas de manera más eficaz y navegar entre muchos conceptos, sin embargo, requieren mucho esfuerzo para ser construidas a mano. Para poder construir una taxonomía en base a un grupo de documentos, primero se debe extraer los conceptos más relevantes presentes en dichos textos. Luego, se debe deducir la jerarquía se convertirá en la taxonomía. Para extraer los conceptos más relevantes de un grupo de documentos, el método CFinder ha probado ser muy útil y dar buenos resultados. El objetivo del CFinder es que sea usado para la construcción de ontologías u otro tipo de estructura que requiera una fase de extracción de conceptos clave. No obstante, no se ha integrado con un método que permita estructurar la jerarquía entre los conceptos extraídos. En este proyecto se busca complementar el método CFinder con una fase para la deducción de jerarquías entre los conceptos extraídos y la construcción de una taxonomía, de esta manera, se está brindando una nueva opción para la construcción automática de taxonomías. Para ello, se realiza la implementación de una herramienta para la construcción automática de una taxonomía de un dominio que haga uso del método CFinder. El proyecto inicia con la implementación de un módulo que permite la extracción de conceptos clave de un conjunto de documentos usando el método CFinder. Luego, se procede a implementar un módulo que permita extraer una taxonomía usando los conceptos clave extraídos. Finalmente, se realizan las pruebas necesarias para medir la eficacia del método implementado y, con los resultados obtenidos, se concluye que se alcanzó el objetivo principal del proyecto. |
| publishDate |
2015 |
| dc.date.accessioned.es_ES.fl_str_mv |
2015-06-04T23:58:32Z |
| dc.date.available.es_ES.fl_str_mv |
2015-06-04T23:58:32Z |
| dc.date.created.es_ES.fl_str_mv |
2015 |
| dc.date.issued.fl_str_mv |
2015-06-04 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/6050 |
| url |
http://hdl.handle.net/20.500.12404/6050 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/3839588e-d98f-4585-a9a0-cf0a2558000c/download https://tesis.pucp.edu.pe/bitstreams/4539957e-c18a-4dee-b8f5-ada6e50cd890/download https://tesis.pucp.edu.pe/bitstreams/6af1e9ac-ff65-4866-a121-b5d90edf5d98/download https://tesis.pucp.edu.pe/bitstreams/aa0ed010-0b1d-4b45-86fd-38f75d39af23/download https://tesis.pucp.edu.pe/bitstreams/29e87b5e-185d-491e-a199-ea4a2290692b/download https://tesis.pucp.edu.pe/bitstreams/5560ddb6-4afb-41be-9771-125c2549671e/download https://tesis.pucp.edu.pe/bitstreams/3011a9ba-0ff1-4202-b00c-d4ee30eaed7b/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 52a1bfc817ae56762b3519bef2f8eeb1 ae7e8e30b6c05c320e71997d16db915b dece00cddae5aed91dd549bcfc9c39bd 6c7622ed69246e83c453f5b436d06272 d19bea90e0a75f62de61d3e3a327c72f 7aa25c1b903b33c5ad65ecc7de5c7715 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834737014305456128 |
| spelling |
Melgar Sasieta, Héctor AndrésVargas Rosales, Alfredo Adrián2015-06-04T23:58:32Z2015-06-04T23:58:32Z20152015-06-04http://hdl.handle.net/20.500.12404/6050Gracias a la World Wide Web la idea de información compartida alrededor del mundo es común para todos, la información es ingresada desde diferentes fuentes para que todos puedan verla y usarla. Una Smart Web o Semantic Web tiene como objetivo estructurar los contenidos de forma tal que todo esté relacionado y por lo tanto, presente información consistente. Para ello, se requieren de estructuras que puedan ser accesadas por computadoras y contengan reglas de inferencia para un razonamiento automático. Una de estas estructuras es la ontología. Una ontología busca conceptualizar el conocimiento de un dominio específico valiéndose de representaciones. Como primer paso para construir una ontología, se debe obtener una taxonomía. Una taxonomía es una clasificación de entidades de información a manera de jerarquías. Las taxonomías ofrecen diversas ventajas como clasificar de la información, realizar búsquedas de manera más eficaz y navegar entre muchos conceptos, sin embargo, requieren mucho esfuerzo para ser construidas a mano. Para poder construir una taxonomía en base a un grupo de documentos, primero se debe extraer los conceptos más relevantes presentes en dichos textos. Luego, se debe deducir la jerarquía se convertirá en la taxonomía. Para extraer los conceptos más relevantes de un grupo de documentos, el método CFinder ha probado ser muy útil y dar buenos resultados. El objetivo del CFinder es que sea usado para la construcción de ontologías u otro tipo de estructura que requiera una fase de extracción de conceptos clave. No obstante, no se ha integrado con un método que permita estructurar la jerarquía entre los conceptos extraídos. En este proyecto se busca complementar el método CFinder con una fase para la deducción de jerarquías entre los conceptos extraídos y la construcción de una taxonomía, de esta manera, se está brindando una nueva opción para la construcción automática de taxonomías. Para ello, se realiza la implementación de una herramienta para la construcción automática de una taxonomía de un dominio que haga uso del método CFinder. El proyecto inicia con la implementación de un módulo que permite la extracción de conceptos clave de un conjunto de documentos usando el método CFinder. Luego, se procede a implementar un módulo que permita extraer una taxonomía usando los conceptos clave extraídos. Finalmente, se realizan las pruebas necesarias para medir la eficacia del método implementado y, con los resultados obtenidos, se concluye que se alcanzó el objetivo principal del proyecto.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Web semánticaInteligencia computacionalTecnología de la informaciónEstructura de datos (Computación)https://purl.org/pe-repo/ocde/ford#1.02.00Desarrollo de una herramienta que permita la extracción de una taxonomía de un conjunto de documentos de un dominio específico usando CFinder para la extracción de conceptos claveinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería.Ingeniería Informática10145776https://orcid.org/0000-0003-1110-123X612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/3839588e-d98f-4585-a9a0-cf0a2558000c/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADORIGINALVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdfVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdfapplication/pdf10223017https://tesis.pucp.edu.pe/bitstreams/4539957e-c18a-4dee-b8f5-ada6e50cd890/download52a1bfc817ae56762b3519bef2f8eeb1MD51trueAnonymousREADVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdfVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdfapplication/pdf2244254https://tesis.pucp.edu.pe/bitstreams/6af1e9ac-ff65-4866-a121-b5d90edf5d98/downloadae7e8e30b6c05c320e71997d16db915bMD52falseAnonymousREADTEXTVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdf.txtVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdf.txtExtracted texttext/plain111604https://tesis.pucp.edu.pe/bitstreams/aa0ed010-0b1d-4b45-86fd-38f75d39af23/downloaddece00cddae5aed91dd549bcfc9c39bdMD58falseAnonymousREADVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdf.txtVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdf.txtExtracted texttext/plain19038https://tesis.pucp.edu.pe/bitstreams/29e87b5e-185d-491e-a199-ea4a2290692b/download6c7622ed69246e83c453f5b436d06272MD510falseAnonymousREADTHUMBNAILVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdf.jpgVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA.pdf.jpgIM Thumbnailimage/jpeg32048https://tesis.pucp.edu.pe/bitstreams/5560ddb6-4afb-41be-9771-125c2549671e/downloadd19bea90e0a75f62de61d3e3a327c72fMD59falseAnonymousREADVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdf.jpgVARGAS_ALFREDO_HERRAMIENTA_EXTRACCIÓN_TAXONOMÍA_ANEXOS.pdf.jpgIM Thumbnailimage/jpeg23473https://tesis.pucp.edu.pe/bitstreams/3011a9ba-0ff1-4202-b00c-d4ee30eaed7b/download7aa25c1b903b33c5ad65ecc7de5c7715MD511falseAnonymousREAD20.500.12404/6050oai:tesis.pucp.edu.pe:20.500.12404/60502025-03-12 17:55:10.676http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.90587 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).