Automatická extrakce schématu z RDF dat
Automatic schema extraction from RDF data
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/183047Identifikátory
SIS: 238913
Kolekce
- Kvalifikační práce [11214]
Autor
Vedoucí práce
Oponent práce
Nečaský, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové a datové inženýrství
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
29. 6. 2023
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
schéma|rdf|sparql|extrakce schématuKlíčová slova (anglicky)
schema|rdf|sparql|schema extractionResource Description Framework (RDF) je datový model pro reprezentaci sémantických dat. RDF umožňuje uložení informací bez pevného schématu. To poskytuje více flexibility, ale absence pevného schématu představuje významnou vstupní bariéru pro využití těchto dat. Jazyk SPARQL se používá pro dotazování databází s RDF daty. Existuje několik řešení v oblasti extrakce schématu s využitím jazyka SPARQL. Většina řešení se přiklání k poskytnutí vizuální reprezentace schématu spíše než k tvorbě okamžitě použitelné výstupu. Mnoho těchto řešení provádí velmi důkladnou a dlouhou extrakci, která není vhodná pro prostředí webové aplikace, a některé nejsou dokonce dostupné online. Tato práce představuje TypeSPARQ, open-source webovou aplikaci pro ex- trakci schématu ze SPARQL endpointů. TypeSPARQ vytváří vizualizaci schématu koncového bodu a nabízí možnosti jeho exportu. TypeSPARQ je in- tegrovaná s knihovnou LDKit, která poskytuje bezpečný typovaný přístup ke SPARQL endpointům pro TypeScript aplikace. Tyto nástroje dohromady nabízejí TypeScriptovým vývojářům bezproblémový průběh vývoje od průzkumu koncového bodu po jeho integraci do projektů. 1
The Resource Description Framework (RDF) is a model for the representation of semantic data. RDF allows the storage of information without a fixed schema. This provides more flexibility but the lack of a fixed schema poses a significant entry barrier to the utilisation of the stored data. The SPARQL language is used for querying an RDF database. Several works exist in the domain of schema extraction from SPARQL end- points. Most tend to provide a visual representation of the schema, rather than an immediately usable output. Many of these solutions perform a very thorough and lengthy extraction unsuitable for a web application environment and some are not even available online. This thesis introduces TypeSPARQ, an open-source web application for ex- tracting schemata from SPARQL endpoints. TypeSPARQ creates a visualisation of the endpoint's schema and offers options for exporting it. TypeSPARQ in- tegrates with LDKit, which provides type-safe access to SPARQL endpoints for TypeScript applications. These tools combined offer TypeScript developers a seamless process from endpoint exploration to integrating the endpoint within their projects. 1