Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
Descripción del Articulo
En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2018 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/12282 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/12282 |
| Nivel de acceso: | acceso abierto |
| Materia: | Motores de búsqueda Programas para computadoras--Desarrollo https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_c5f6db2cb451b95409eecf821f606d8c |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/12282 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| title |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| spellingShingle |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados Uribe Canchanya, Iván Renato Motores de búsqueda Programas para computadoras--Desarrollo https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| title_full |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| title_fullStr |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| title_full_unstemmed |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| title_sort |
Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados |
| author |
Uribe Canchanya, Iván Renato |
| author_facet |
Uribe Canchanya, Iván Renato |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Melgar Sasieta, Héctor Andrés |
| dc.contributor.author.fl_str_mv |
Uribe Canchanya, Iván Renato |
| dc.subject.es_ES.fl_str_mv |
Motores de búsqueda Programas para computadoras--Desarrollo |
| topic |
Motores de búsqueda Programas para computadoras--Desarrollo https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información. |
| publishDate |
2018 |
| dc.date.accessioned.es_ES.fl_str_mv |
2018-07-10T19:55:05Z |
| dc.date.available.es_ES.fl_str_mv |
2018-07-10T19:55:05Z |
| dc.date.created.es_ES.fl_str_mv |
2018 |
| dc.date.issued.fl_str_mv |
2018-07-10 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/12282 |
| url |
http://hdl.handle.net/20.500.12404/12282 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/69d2b540-ead3-40c3-8517-a4f9540263d0/download https://tesis.pucp.edu.pe/bitstreams/315d29df-314a-43b3-b87a-a829048e90ec/download https://tesis.pucp.edu.pe/bitstreams/08d160b4-b0b1-4840-bcd3-3c5d636d2192/download https://tesis.pucp.edu.pe/bitstreams/aa546ed8-35c9-41da-8c13-c1f1e1a4bd66/download https://tesis.pucp.edu.pe/bitstreams/d26c16a1-95bc-4d08-a979-a0d1dc2cbc4d/download https://tesis.pucp.edu.pe/bitstreams/824c5dc0-b4b1-4bf6-90a9-c3e8abfb95c7/download https://tesis.pucp.edu.pe/bitstreams/064741e3-2be1-4adc-97a8-94bd1c29ff97/download |
| bitstream.checksum.fl_str_mv |
96d654b1e81387f26eb2711447a24b38 1ed5e2a48fa4feaa96e24521e63b7add 8a4605be74aa9ea9d79846c1fba20a33 9e752af0e9545a66a51d2ecd1e56652f 0fc6fa43b1b0cc2f3a16297c3e951dcc 970d73914255bd983eb273d582eb4232 b8ee15dea98113eafed904ef4144b5bc |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834736824557240320 |
| spelling |
Melgar Sasieta, Héctor AndrésUribe Canchanya, Iván Renato2018-07-10T19:55:05Z2018-07-10T19:55:05Z20182018-07-10http://hdl.handle.net/20.500.12404/12282En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Motores de búsquedaProgramas para computadoras--Desarrollohttps://purl.org/pe-repo/ocde/ford#1.02.00Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazadosinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática10145776https://orcid.org/0000-0003-1110-123X612286https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdfURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdfTexto completoapplication/pdf2405128https://tesis.pucp.edu.pe/bitstreams/69d2b540-ead3-40c3-8517-a4f9540263d0/download96d654b1e81387f26eb2711447a24b38MD51trueAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdfURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdfAnexosapplication/pdf590050https://tesis.pucp.edu.pe/bitstreams/315d29df-314a-43b3-b87a-a829048e90ec/download1ed5e2a48fa4feaa96e24521e63b7addMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/08d160b4-b0b1-4840-bcd3-3c5d636d2192/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.jpgURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.jpgIM Thumbnailimage/jpeg13655https://tesis.pucp.edu.pe/bitstreams/aa546ed8-35c9-41da-8c13-c1f1e1a4bd66/download9e752af0e9545a66a51d2ecd1e56652fMD54falseAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.jpgURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.jpgIM Thumbnailimage/jpeg12677https://tesis.pucp.edu.pe/bitstreams/d26c16a1-95bc-4d08-a979-a0d1dc2cbc4d/download0fc6fa43b1b0cc2f3a16297c3e951dccMD56falseAnonymousREADTEXTURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.txtURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES.pdf.txtExtracted texttext/plain147281https://tesis.pucp.edu.pe/bitstreams/824c5dc0-b4b1-4bf6-90a9-c3e8abfb95c7/download970d73914255bd983eb273d582eb4232MD55falseAnonymousREADURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.txtURIBE_IVAN_SOFTWARE_BUSQUEDA_PUBLICACIONES_ANEXOS.pdf.txtExtracted texttext/plain24189https://tesis.pucp.edu.pe/bitstreams/064741e3-2be1-4adc-97a8-94bd1c29ff97/downloadb8ee15dea98113eafed904ef4144b5bcMD57falseAnonymousREAD20.500.12404/12282oai:tesis.pucp.edu.pe:20.500.12404/122822025-03-12 17:46:07.825http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.936249 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).