Dotazování nad RDF daty
RDF querying
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/4450Identifiers
Study Information System: 43045
Collections
- Kvalifikační práce [11216]
Author
Advisor
Referee
Vojtáš, Peter
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
22. 5. 2006
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Jazyk RDF je základním stavebním kamenem Sémantickího webu. Je to nástroj pro popis zdrojů na webu. De finuje však pouze formát a sémantiku dat, ne však způsob, jak se na tato data dotazovat. Cílem této práce bylo vytvořit systém, který by umožnil dotazování nad RDF daty. Byla vytvořena částečná implementace jazyka SPARQL. Standard SPARQL je v současné době vyvíjen konzorciem W3C. Pro uložení RDF dat byla vybrána relační databáze Oracle a bylo navrženo relační schéma, které umožňuje přeložit SPARQL dotazy na SQL dotazy. Navržené postupy byly otestovány nad rozsáhlými RDF daty. Pro ukázkové SPARQL dotazy byla provedena měření rychlosti vyhodnocení převedených dotazů. Analýza faktorů negativně ovlivňujících rychlost vedla k návrhu dvou možných vylepšení. Jedno z nich bylo implementováno a jeho přínos byl otestován nad daty.
The RDF is one of the basic technologies of the Semantic Web. It is a language describing resources on the web. It de nes the format and semantics of such data but does not provide query capabilities. The aim of this thesis is to create system capable of querying RDF data. We have created a partial implementation of the SPARQL query language. The SPARQL standard is currently being developed by the W3C Consorcium. We have chosen the Oracle relational database to store the RDF data. The proposed database schema allows us to evaluate SPARQL queries by translating them into SQL queries. The proposed methods have been tested on a large set of RDF data. We have created several examples of SPARQL queries, translated them to SQL, and measured the evaluation time of the translated queries. Afterwards, factors with negative impact on the evaluation speed have been analyzed. We have proposed two ways of improving the evaluation times based on this analysis, implemented one of them, and measured its e ffects.