Automatická extrakce schématu z RDF dat
Automatic schema extraction from RDF data
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/183047Identifiers
Study Information System: 238913
Collections
- Kvalifikační práce [10925]
Author
Advisor
Referee
Nečaský, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software and Data Engineering
Department
Department of Software Engineering
Date of defense
29. 6. 2023
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
schéma|rdf|sparql|extrakce schématuKeywords (English)
schema|rdf|sparql|schema extractionResource Description Framework (RDF) je datový model pro reprezentaci sémantických dat. RDF umožňuje uložení informací bez pevného schématu. To poskytuje více flexibility, ale absence pevného schématu představuje významnou vstupní bariéru pro využití těchto dat. Jazyk SPARQL se používá pro dotazování databází s RDF daty. Existuje několik řešení v oblasti extrakce schématu s využitím jazyka SPARQL. Většina řešení se přiklání k poskytnutí vizuální reprezentace schématu spíše než k tvorbě okamžitě použitelné výstupu. Mnoho těchto řešení provádí velmi důkladnou a dlouhou extrakci, která není vhodná pro prostředí webové aplikace, a některé nejsou dokonce dostupné online. Tato práce představuje TypeSPARQ, open-source webovou aplikaci pro ex- trakci schématu ze SPARQL endpointů. TypeSPARQ vytváří vizualizaci schématu koncového bodu a nabízí možnosti jeho exportu. TypeSPARQ je in- tegrovaná s knihovnou LDKit, která poskytuje bezpečný typovaný přístup ke SPARQL endpointům pro TypeScript aplikace. Tyto nástroje dohromady nabízejí TypeScriptovým vývojářům bezproblémový průběh vývoje od průzkumu koncového bodu po jeho integraci do projektů. 1
The Resource Description Framework (RDF) is a model for the representation of semantic data. RDF allows the storage of information without a fixed schema. This provides more flexibility but the lack of a fixed schema poses a significant entry barrier to the utilisation of the stored data. The SPARQL language is used for querying an RDF database. Several works exist in the domain of schema extraction from SPARQL end- points. Most tend to provide a visual representation of the schema, rather than an immediately usable output. Many of these solutions perform a very thorough and lengthy extraction unsuitable for a web application environment and some are not even available online. This thesis introduces TypeSPARQ, an open-source web application for ex- tracting schemata from SPARQL endpoints. TypeSPARQ creates a visualisation of the endpoint's schema and offers options for exporting it. TypeSPARQ in- tegrates with LDKit, which provides type-safe access to SPARQL endpoints for TypeScript applications. These tools combined offer TypeScript developers a seamless process from endpoint exploration to integrating the endpoint within their projects. 1