Reducción de redundancia en documentos RDF utilizando propiedades ontológicas
Descripción del Articulo
La Web Semántica nace como una iniciativa para la integración y combinación de datos de diferentes fuentes, basada en el modelo de datos Resource Descripción Framework (RDF). Aunque la recuperación de la información en RDF ha sido ampliamente estudiada, aún existen limitaciones en cuanto a: (i) cons...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Católica San Pablo |
| Repositorio: | UCSP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucsp.edu.pe:20.500.12590/18134 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12590/18134 |
| Nivel de acceso: | acceso abierto |
| Materia: | Web semántica Redundancia RDF OWL Propiedades ontológicas https://purl.org/pe-repo/ocde/ford#1.02.01 |
| Sumario: | La Web Semántica nace como una iniciativa para la integración y combinación de datos de diferentes fuentes, basada en el modelo de datos Resource Descripción Framework (RDF). Aunque la recuperación de la información en RDF ha sido ampliamente estudiada, aún existen limitaciones en cuanto a: (i) consistencia de datos, (ii) redundancia de datos, (iii) escalabilidad en el procesamiento, entre otros. Dado que la Web Semántica se caracteriza por enlazar bases de datos de diferentes fuentes, la probabilidad de obtener resultados redundantes en las consultas aumenta drásticamente. Los problemas con la redundancia de datos son principalmente (i) el espacio que se desaprovecha en el almacenamiento y (ii) el aumento de complejidad en la fase de procesamiento de las consultas. En este contexto, este trabajo propone una técnica que utiliza propiedades ontológicas, para mejorar la recuperación de información RDF a través de la reducción de la redundancia en los datos, manteniendo la consistencia de la información y la mejora del desempeño en el procesamiento de la consulta. La propuesta hace uso de dos propiedades ontológicas, donde owl:sameAs y owl:contains se encargan de reducir la redundancia total y parcial respectiva- mente entre distintos conjuntos. Además, nuestra técnica tomo como base la técnica RDF2NormRDF propuesto por [Ticona Herrera et al., 2015]. Nuestra propuesta fue evaluada utilizando 4 bases de datos disponibles en la web y se definió métricas de evaluación para medir el rendimiento y aplicabilidad, las cuales son: Porcentaje de reducción de número de tripletas, porcentaje de reducción de tamaño en bytes, tiempo promedio de ejecución de reducción, tiempo de lectura de Jena, e información original. Los experimentos demostraron que la técnica propuesta presenta mejores resultados hasta un 25 % en la base de datos de DBpedia, el cual describe diferentes clases de DBpedia. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).