Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados

Descripción del Articulo

En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información...

Descripción completa

Detalles Bibliográficos
Autor: Uribe Canchanya, Iván Renato
Formato: tesis de grado
Fecha de Publicación:2018
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/12282
Enlace del recurso:http://hdl.handle.net/20.500.12404/12282
Nivel de acceso:acceso abierto
Materia:Motores de búsqueda
Programas para computadoras--Desarrollo
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_c5f6db2cb451b95409eecf821f606d8c
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/12282
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
title Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
spellingShingle Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
Uribe Canchanya, Iván Renato
Motores de búsqueda
Programas para computadoras--Desarrollo
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
title_full Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
title_fullStr Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
title_full_unstemmed Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
title_sort Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
author Uribe Canchanya, Iván Renato
author_facet Uribe Canchanya, Iván Renato
author_role author
dc.contributor.advisor.fl_str_mv Melgar Sasieta, Héctor Andrés
dc.contributor.author.fl_str_mv Uribe Canchanya, Iván Renato
dc.subject.es_ES.fl_str_mv Motores de búsqueda
Programas para computadoras--Desarrollo
topic Motores de búsqueda
Programas para computadoras--Desarrollo
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información.
publishDate 2018
dc.date.accessioned.es_ES.fl_str_mv 2018-07-10T19:55:05Z
dc.date.available.es_ES.fl_str_mv 2018-07-10T19:55:05Z
dc.date.created.es_ES.fl_str_mv 2018
dc.date.issued.fl_str_mv 2018-07-10
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/12282
url http://hdl.handle.net/20.500.12404/12282
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/69d2b540-ead3-40c3-8517-a4f9540263d0/download
https://tesis.pucp.edu.pe/bitstreams/315d29df-314a-43b3-b87a-a829048e90ec/download
https://tesis.pucp.edu.pe/bitstreams/08d160b4-b0b1-4840-bcd3-3c5d636d2192/download
https://tesis.pucp.edu.pe/bitstreams/aa546ed8-35c9-41da-8c13-c1f1e1a4bd66/download
https://tesis.pucp.edu.pe/bitstreams/d26c16a1-95bc-4d08-a979-a0d1dc2cbc4d/download
https://tesis.pucp.edu.pe/bitstreams/824c5dc0-b4b1-4bf6-90a9-c3e8abfb95c7/download
https://tesis.pucp.edu.pe/bitstreams/064741e3-2be1-4adc-97a8-94bd1c29ff97/download
bitstream.checksum.fl_str_mv 96d654b1e81387f26eb2711447a24b38
1ed5e2a48fa4feaa96e24521e63b7add
8a4605be74aa9ea9d79846c1fba20a33
9e752af0e9545a66a51d2ecd1e56652f
0fc6fa43b1b0cc2f3a16297c3e951dcc
970d73914255bd983eb273d582eb4232
b8ee15dea98113eafed904ef4144b5bc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736824557240320
spelling Melgar Sasieta, Héctor AndrésUribe Canchanya, Iván Renato2018-07-10T19:55:05Z2018-07-10T19:55:05Z20182018-07-10http://hdl.handle.net/20.500.12404/12282En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Motores de búsquedaProgramas para computadoras--Desarrollohttps://purl.org/pe-repo/ocde/ford#1.02.00Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazadosinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática10145776https://orcid.org/0000-0003-1110-123X612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdfURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdfTexto completoapplication/pdf2405128https://tesis.pucp.edu.pe/bitstreams/69d2b540-ead3-40c3-8517-a4f9540263d0/download96d654b1e81387f26eb2711447a24b38MD51trueAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdfURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdfAnexosapplication/pdf590050https://tesis.pucp.edu.pe/bitstreams/315d29df-314a-43b3-b87a-a829048e90ec/download1ed5e2a48fa4feaa96e24521e63b7addMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/08d160b4-b0b1-4840-bcd3-3c5d636d2192/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.jpgURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.jpgIM Thumbnailimage/jpeg13655https://tesis.pucp.edu.pe/bitstreams/aa546ed8-35c9-41da-8c13-c1f1e1a4bd66/download9e752af0e9545a66a51d2ecd1e56652fMD54falseAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.jpgURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.jpgIM Thumbnailimage/jpeg12677https://tesis.pucp.edu.pe/bitstreams/d26c16a1-95bc-4d08-a979-a0d1dc2cbc4d/download0fc6fa43b1b0cc2f3a16297c3e951dccMD56falseAnonymousREADTEXTURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.txtURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.txtExtracted texttext/plain147281https://tesis.pucp.edu.pe/bitstreams/824c5dc0-b4b1-4bf6-90a9-c3e8abfb95c7/download970d73914255bd983eb273d582eb4232MD55falseAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.txtURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.txtExtracted texttext/plain24189https://tesis.pucp.edu.pe/bitstreams/064741e3-2be1-4adc-97a8-94bd1c29ff97/downloadb8ee15dea98113eafed904ef4144b5bcMD57falseAnonymousREAD20.500.12404/12282oai:tesis.pucp.edu.pe:20.500.12404/122822025-03-12 17:46:07.825http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).