Mapování a dolování ontologií s uživatelskou preferencí
Ontology mapping and mining with user preference
Mapování a dolování ontologií s uživatelskou preferencí
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/13217Identifiers
Study Information System: 43486
CU Caralogue: 990009309850106986
Collections
- Kvalifikační práce [11349]
Author
Advisor
Referee
Hoksza, David
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
18. 9. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Excellent
V tejto diplomovej práci sa zaoberáme problémom mapovania a dolovania ontológií. Dolovanie ontológií je učenie ontológií z inštancií. Prvým krokom tochto procesu je samotné dolovanie inštancií. Navrhli sme spôsob pre dolovanie inštancií z webových dokumentoch obsahujúcich štrukturované záznamy. Datové záznamy hľadáme v HTML strome webového dokumentu. Záznamy hľadáme len v relevantných vetvách HTML stromu a identifikujeme taktiež prekryvajúce sa záznamy. Navrli sme spôsob identifikácie atribútov a ich mapovanie na atribúty konceptov ontológie. Preskúmali sme aj iné možné alternatívy pre dolovanie inštancií, vrátane použitia OCR nástrojov na spracovanie vizuálnej podoby dokumentu. Prevedené experimenty nad niekoľkými typmi webových dokumentoch potvrdzujú správny smer nášho výskumu.
In this diploma thesis we deal with the problem of ontology mining and mapping. Ontology mining is ontology learning from instance. First step to ontology mining is instance mining. We present method for ontology instance mining from web pages that contain structured data records. We use HTML tree of the page to detect data records. We search data records only in relevant branches of HTML tree and we identify also non-contiguous records. Next we present method to identify attributes of record and their mapping into attributes of ontology concepts. We discuss also several alternative methods including OCR usage for processing visual form of web document . Results of experiments on several types of web documents show a right direction of our research.