Vyhledávací stroj pro matematiku
Vyhledávací stroj pro matematiku
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/13264Identifiers
Study Information System: 44036
Collections
- Kvalifikační práce [11216]
Author
Advisor
Referee
Skopal, Tomáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
18. 9. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Vyhladávacie stroje (napr. Google) vládnu obsahu dnešného WWW. Sú neoddelitelnou súcastou každodenného prístupu k informáciám. Veda, ktorá sa zaoberá práve vyhladávacími strojmi, sa sústreduje na vyhladávanie prirodzených castí jazyka - slov. V posledných rokoch sa rozšírila pôsobnost vyhladávacov aj na iné oblasti. Velkost matematických dát na WWW enormne narástla. Dôležitost matematických vyhladávacích strojov je evidentná. Aj napriek tomuto vývoju, sa oblast vedy skúmajúca matematické vyhladávanie donedávna zanedbávala. Napriek tomu, že aktívny výskum napreduje vo vývoji, zatial bolo prezentovaných len niekolko málo výsledkov. Hlavným cielom tejto práce je vyplnit túto medzeru. Nový matematický vyhladávací stroj bol navrhnutý so zameraním sa na použitelnost. Jediný vyhladávací stroj schopný efektívne indexovat WWW - cisto textový (fulltextový) vyhladávací stroj - bol použitý ako základ a vypracovaný návrh ako jeho rozšírenie. Toto umožnuje využívat všetky výhody fulltextového vyhladávacieho stroja. Väcšina matematických dokumentov neobsahuje informáciu o sémantike. Riešenie tohoto problému je základným cielom tejto diplomovej práce. Testovanie ukázalo, že navrhovaný vyhladávací stroj má viacero výhod. Najdôležitejšou je použitelnost pre velkú množinu matematických dokumentov s minimálnym sémantickým...
The WWW is dominated by search engines such as Google. They are inseparable part of everyday search for information. Theoretical research field interested in searching, the information retrieval, focuses mainly on the natural language constructs - words. During the last years the field has been extended to other searchable content as well. The world of mathematical knowledge on the WWW has grown enormously. The importance of a general mathematical search engine is clear. However, this research field had been abandoned until very recently. Despite the fact that an active ongoing research is in progress, few practical results have been presented. The main goal of this thesis is to fill this gap. A new mathematical search engine was proposed with the focus on applicability. As the only capable search engine of indexing WWW effectively is the full text search engine it was used as the basis. The mathematical extension was designed as an extension which allows it to exploit and use all the advantages of the full text search engine. Most of the mathematical documents do not contain semantic information. The solution to this problem was one of the main goals of this thesis. The extensive evaluation showed that the proposed search engine has many advantages. The most important one is the usability over a large...