Dolování dat z webu
Webmining
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/9947Identifiers
Study Information System: 41193
CU Caralogue: 990008347720106986
Collections
- Kvalifikační práce [11349]
Author
Advisor
Referee
Húsek, Dušan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Department of Software Engineering
Date of defense
21. 5. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Tato práce se soustředí na zmapování současných poznatků v oblasti dolování dat z webu s důrazem na shlukování dokumentů. Nejpodrobněji je zkoumán algoritmus projektivního shlukování DOC, je uvedena jeho modifikace pro data s váženými dimenzemi. Algoritmus je aplikován při shlukování výsledků webového vyhledávače. Součástí práce je implementace Javovského shlukovacího balíčku s rozhraním pro vyhledávač Google a s nástrojem pro hodnocení kvality frází.
This thesis focuses on mapping latest knowledge in the area of web mining with emphasis on document clustering. Most attention is given to the DOC projective clustering algorithm, a modification is presented for data with weighted dimensions. Algorithm is used for web search engine result clustering. Also, a clustering package with Google interface and phrase evaluation tool is implemented.