Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías

Descripción del Articulo

Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es indispensable para pod...

Descripción completa

Detalles Bibliográficos
Autor: Coronado Altamirano, Gustavo
Formato: tesis de grado
Fecha de Publicación:2017
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/9181
Enlace del recurso:http://hdl.handle.net/20.500.12404/9181
Nivel de acceso:acceso abierto
Materia:Web semántica
Información--Sistemas de almacenamiento y recuperación
Recuperación de la información
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_96956031b1ced3c65c537fe7221b6de6
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/9181
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
title Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
spellingShingle Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
Coronado Altamirano, Gustavo
Web semántica
Información--Sistemas de almacenamiento y recuperación
Recuperación de la información
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
title_full Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
title_fullStr Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
title_full_unstemmed Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
title_sort Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
author Coronado Altamirano, Gustavo
author_facet Coronado Altamirano, Gustavo
author_role author
dc.contributor.advisor.fl_str_mv Melgar Sasieta, Héctor Andrés
dc.contributor.author.fl_str_mv Coronado Altamirano, Gustavo
dc.subject.es_ES.fl_str_mv Web semántica
Información--Sistemas de almacenamiento y recuperación
Recuperación de la información
topic Web semántica
Información--Sistemas de almacenamiento y recuperación
Recuperación de la información
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es indispensable para poder encontrar contenido específico y relevante para el usuario, es decir, información precisa y alineada con el tema de su interés. Sin embargo, los buscadores pueden presentar dificultades para brindar al usuario la información deseada. Estas dificultades se presentan por motivos tales como las características propias del lenguaje natural como la polisemia, sinonimia y ambigüedad; así, también, por el desconocimiento de los temas que son de interés para el usuario. Otra de las causas que dificultan la recuperación de información relevante es que la búsqueda de resultados se realiza de manera sintáctica, esto es, buscando en los documentos la coincidencia exacta de los términos ingresados en la cadena de búsqueda. Del mismo modo, otra razón importante es que los formatos e interfaces de contenido se presentan en formatos comprensibles solo por las personas y no por un computador. Ante esto, el presente proyecto propone una alternativa de solución de forma tal que los documentos contengan información adicional que describa los conceptos y entidades principales del contenido. Esta información adicional se añadirá de manera automática a los documentos mediante anotaciones semánticas en base a un dominio de conocimiento que sea de interés para el usuario. De esta manera, se pretende apoyar el concepto de Web semántica cuya propuesta es clasificar, estructurar y anotar los recursos con semántica explícita para que puedan ser procesados por sistemas inteligentes.
publishDate 2017
dc.date.accessioned.es_ES.fl_str_mv 2017-08-10T00:58:43Z
dc.date.available.es_ES.fl_str_mv 2017-08-10T00:58:43Z
dc.date.created.es_ES.fl_str_mv 2017
dc.date.issued.fl_str_mv 2017-08-10
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/9181
url http://hdl.handle.net/20.500.12404/9181
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/452bc644-511e-4a2b-8c92-ea815a34e691/download
https://tesis.pucp.edu.pe/bitstreams/959faa24-8fc0-4f2e-9ff3-fe7eb413295a/download
https://tesis.pucp.edu.pe/bitstreams/091d488e-268a-4ec8-a72c-bdc9b7a78326/download
https://tesis.pucp.edu.pe/bitstreams/cfd6fb6d-6d14-4a14-bb3c-c3aa86f05fcd/download
https://tesis.pucp.edu.pe/bitstreams/53dcd5b0-2f09-487f-902a-e60a342107d5/download
https://tesis.pucp.edu.pe/bitstreams/0c5d176f-c326-4f2b-a803-dbfbf8f3fc23/download
https://tesis.pucp.edu.pe/bitstreams/bb138725-b61b-43d4-9b30-429572cbdaee/download
bitstream.checksum.fl_str_mv de735743d809a91481b975ff56d68097
146f1cedf44605bed92888e75ac77c47
8a4605be74aa9ea9d79846c1fba20a33
2d44686f713685a3a94db887c9995b9f
f97f4c9681c6be4e9c33300b554b0523
e378ea75ddb5ce15e3c2559c81b75b74
8af81ddbb6b873f770cd065a39bea2b6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736871031177216
spelling Melgar Sasieta, Héctor AndrésCoronado Altamirano, Gustavo2017-08-10T00:58:43Z2017-08-10T00:58:43Z20172017-08-10http://hdl.handle.net/20.500.12404/9181Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es indispensable para poder encontrar contenido específico y relevante para el usuario, es decir, información precisa y alineada con el tema de su interés. Sin embargo, los buscadores pueden presentar dificultades para brindar al usuario la información deseada. Estas dificultades se presentan por motivos tales como las características propias del lenguaje natural como la polisemia, sinonimia y ambigüedad; así, también, por el desconocimiento de los temas que son de interés para el usuario. Otra de las causas que dificultan la recuperación de información relevante es que la búsqueda de resultados se realiza de manera sintáctica, esto es, buscando en los documentos la coincidencia exacta de los términos ingresados en la cadena de búsqueda. Del mismo modo, otra razón importante es que los formatos e interfaces de contenido se presentan en formatos comprensibles solo por las personas y no por un computador. Ante esto, el presente proyecto propone una alternativa de solución de forma tal que los documentos contengan información adicional que describa los conceptos y entidades principales del contenido. Esta información adicional se añadirá de manera automática a los documentos mediante anotaciones semánticas en base a un dominio de conocimiento que sea de interés para el usuario. De esta manera, se pretende apoyar el concepto de Web semántica cuya propuesta es clasificar, estructurar y anotar los recursos con semántica explícita para que puedan ser procesados por sistemas inteligentes.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Web semánticaInformación--Sistemas de almacenamiento y recuperaciónRecuperación de la informaciónhttps://purl.org/pe-repo/ocde/ford#1.02.00Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologíasinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática10145776https://orcid.org/0000-0003-1110-123X612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdfCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdfTexto completoapplication/pdf7888898https://tesis.pucp.edu.pe/bitstreams/452bc644-511e-4a2b-8c92-ea815a34e691/downloadde735743d809a91481b975ff56d68097MD51trueAnonymousREADCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdfCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdfAnexosapplication/pdf838374https://tesis.pucp.edu.pe/bitstreams/959faa24-8fc0-4f2e-9ff3-fe7eb413295a/download146f1cedf44605bed92888e75ac77c47MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/091d488e-268a-4ec8-a72c-bdc9b7a78326/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdf.jpgCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdf.jpgIM Thumbnailimage/jpeg14874https://tesis.pucp.edu.pe/bitstreams/cfd6fb6d-6d14-4a14-bb3c-c3aa86f05fcd/download2d44686f713685a3a94db887c9995b9fMD54falseAnonymousREADCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdf.jpgCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdf.jpgIM Thumbnailimage/jpeg23181https://tesis.pucp.edu.pe/bitstreams/53dcd5b0-2f09-487f-902a-e60a342107d5/downloadf97f4c9681c6be4e9c33300b554b0523MD55falseAnonymousREADTEXTCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdf.txtCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS.pdf.txtExtracted texttext/plain132958https://tesis.pucp.edu.pe/bitstreams/0c5d176f-c326-4f2b-a803-dbfbf8f3fc23/downloade378ea75ddb5ce15e3c2559c81b75b74MD56falseAnonymousREADCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdf.txtCORONADO_GUSTAVO_ANOTACION_SEMANTICA_AUTOMATICA_ONTOLOGIAS_ANEXOS.pdf.txtExtracted texttext/plain7209https://tesis.pucp.edu.pe/bitstreams/bb138725-b61b-43d4-9b30-429572cbdaee/download8af81ddbb6b873f770cd065a39bea2b6MD57falseAnonymousREAD20.500.12404/9181oai:tesis.pucp.edu.pe:20.500.12404/91812025-03-12 17:51:51.068http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.90198
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).