Vyhledávací stroj pro matematiku
Vyhledávací stroj pro matematiku
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/13264Identifikátory
SIS: 44036
Kolekce
- Kvalifikační práce [11216]
Autor
Vedoucí práce
Oponent práce
Skopal, Tomáš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
18. 9. 2007
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Vyhladávacie stroje (napr. Google) vládnu obsahu dnešného WWW. Sú neoddelitelnou súcastou každodenného prístupu k informáciám. Veda, ktorá sa zaoberá práve vyhladávacími strojmi, sa sústreduje na vyhladávanie prirodzených castí jazyka - slov. V posledných rokoch sa rozšírila pôsobnost vyhladávacov aj na iné oblasti. Velkost matematických dát na WWW enormne narástla. Dôležitost matematických vyhladávacích strojov je evidentná. Aj napriek tomuto vývoju, sa oblast vedy skúmajúca matematické vyhladávanie donedávna zanedbávala. Napriek tomu, že aktívny výskum napreduje vo vývoji, zatial bolo prezentovaných len niekolko málo výsledkov. Hlavným cielom tejto práce je vyplnit túto medzeru. Nový matematický vyhladávací stroj bol navrhnutý so zameraním sa na použitelnost. Jediný vyhladávací stroj schopný efektívne indexovat WWW - cisto textový (fulltextový) vyhladávací stroj - bol použitý ako základ a vypracovaný návrh ako jeho rozšírenie. Toto umožnuje využívat všetky výhody fulltextového vyhladávacieho stroja. Väcšina matematických dokumentov neobsahuje informáciu o sémantike. Riešenie tohoto problému je základným cielom tejto diplomovej práce. Testovanie ukázalo, že navrhovaný vyhladávací stroj má viacero výhod. Najdôležitejšou je použitelnost pre velkú množinu matematických dokumentov s minimálnym sémantickým...
The WWW is dominated by search engines such as Google. They are inseparable part of everyday search for information. Theoretical research field interested in searching, the information retrieval, focuses mainly on the natural language constructs - words. During the last years the field has been extended to other searchable content as well. The world of mathematical knowledge on the WWW has grown enormously. The importance of a general mathematical search engine is clear. However, this research field had been abandoned until very recently. Despite the fact that an active ongoing research is in progress, few practical results have been presented. The main goal of this thesis is to fill this gap. A new mathematical search engine was proposed with the focus on applicability. As the only capable search engine of indexing WWW effectively is the full text search engine it was used as the basis. The mathematical extension was designed as an extension which allows it to exploit and use all the advantages of the full text search engine. Most of the mathematical documents do not contain semantic information. The solution to this problem was one of the main goals of this thesis. The extensive evaluation showed that the proposed search engine has many advantages. The most important one is the usability over a large...