Sémantická anotace dat z webovských zdrojů
Semantic annotation of data from web resources
diploma thesis (DEFENDED)
View/ Open
Permanent link
Study Information System: 45974
- Kvalifikační práce [11216]
Pokorný, Jaroslav
Faculty / Institute
Faculty of Mathematics and Physics
Software systems
Department of Software Engineering
Date of defense
18. 9. 2007
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Tato práce se odráží od myšlenky sémantického webu. Stručně rozebírá možnosti formální reprezentace znalostí v deskripční logice a její paralelu v několika formalismech pro tvorbu ontologií. Ukazuje, jak lze využít ontologií při sémantické anotaci webovských zdrojů. Představuje sémantickou anotaci v praxi, v kontextu nkolika projektů z různých oblastí. V práci jsou rozebrány rzné metody extrakce informací, které pomáhají sémantickou anotaci zautomatizovat. Podrobněji jsou v tomto ohledu popsány nástroje, které poskytuje současná česká počítačová lingvistika. Na teoretické úrovni se tato práce dotýká vztahu mezi lingvistickou anotací přirozeného jazyka a formální reprezentací znalostí v deskripční logice. V rámci této práce byl proveden experiment - zpracování českého přirozeného textu několika lingvistickými nástroji za účelem jeho sémantické anotace.
This work starts with the idea of The Semantic Web. Then basic description logics is introduced with its parallel in a couple of formalisms for building of ontology. In this work, there is shown, how the ontologies are employed in the semantic annotation process and also there are described some projects that use semantic annotation in a practical way. Information extraction methods that help to automatize the semantic annotation process are mentioned. Tools for natural language processing of Czech language are described in detail. A practical experiment shows how these tools can help with extraction of information from plain text. This work also deals with the relationship of natural language processing and formal representation of knowledge in description logics.