Zobrazit minimální záznam

Grafové algoritmy ve vyhledávání textových dokumentů
dc.contributor.advisorKopecký, Michal
dc.creatorIrikovský, Peter
dc.date.accessioned2017-04-03T09:58:53Z
dc.date.available2017-04-03T09:58:53Z
dc.date.issued2007
dc.identifier.urihttp://hdl.handle.net/20.500.11956/9322
dc.description.abstractTato diplomová práce zkoumá možnosti využití grafových algoritm ů v oblasti information retrieval (vyhledávání informací). Na zač átku je poskytnut p řehled základních pojm ů z oblasti dokumentografických informa čních systém ů a základě teorie graf . Zbytek práce se pak zabývá prů nikem tě chto dvou oblastí. Mezi př íklady z tohoto prů niku patř í např íklad klastrování a kategorizace dokumentů , i hledání komunit. Nejvíc pozornosti je však soust ředě no na algoritmy hodnotící d ůležitost dokument ů s pomocí využití graf ů. Tyto algoritmy vylepšují nejd ůležitě jší vlastnost informa čních systémů , jejich p řesnost. Práce poskytuje přehled rů zných hodnotících algoritmů založených na grafech a uvádí komentář e k jejich praktič nosti, č asovým a paměť ovým nároků m. V práci je taky detailně popsaná implementace algoritmů na poč ítaní PageRanku stránek navržená pro využití ve vyhledáva či Egothor. Popis také obsahuje výsledky m ěření č asové a pam ěťové nároč nosti a uvádí návrhy na další zlepšení.cs_CZ
dc.description.abstractThis thesis surveys use of graph theory and algorithms in information retrieval. It provides an introduction to graph and information retrieval theories and an overview of the overlap between these disciplines. We show application of the graph theory in clustering, document classification, finding communities etc. The most stress is, however, put on ranking algorithms as they aim to improve the most critical property of the information retrieval systems, their precision. The paper presents different graphbased ranking algorithms, provides comments to their time and memory requirements and to realistic usage of these rankings. It also contains a description and test results of our implementation of algorithms for computing the PageRank distribution designed for the Egothor search engine.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titleGraph algorithms in text retrievalen_US
dc.typediplomová prácecs_CZ
dcterms.created2007
dcterms.dateAccepted2007-05-21
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId46208
dc.title.translatedGrafové algoritmy ve vyhledávání textových dokumentůcs_CZ
dc.contributor.refereeGalamboš, Leo
dc.identifier.aleph000839349
thesis.degree.nameMgr.
thesis.degree.levelmagisterskécs_CZ
thesis.degree.disciplineSoftwarové systémycs_CZ
thesis.degree.disciplineSoftware systemsen_US
thesis.degree.programInformaticsen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csSoftwarové systémycs_CZ
uk.degree-discipline.enSoftware systemsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enInformaticsen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTato diplomová práce zkoumá možnosti využití grafových algoritm ů v oblasti information retrieval (vyhledávání informací). Na zač átku je poskytnut p řehled základních pojm ů z oblasti dokumentografických informa čních systém ů a základě teorie graf . Zbytek práce se pak zabývá prů nikem tě chto dvou oblastí. Mezi př íklady z tohoto prů niku patř í např íklad klastrování a kategorizace dokumentů , i hledání komunit. Nejvíc pozornosti je však soust ředě no na algoritmy hodnotící d ůležitost dokument ů s pomocí využití graf ů. Tyto algoritmy vylepšují nejd ůležitě jší vlastnost informa čních systémů , jejich p řesnost. Práce poskytuje přehled rů zných hodnotících algoritmů založených na grafech a uvádí komentář e k jejich praktič nosti, č asovým a paměť ovým nároků m. V práci je taky detailně popsaná implementace algoritmů na poč ítaní PageRanku stránek navržená pro využití ve vyhledáva či Egothor. Popis také obsahuje výsledky m ěření č asové a pam ěťové nároč nosti a uvádí návrhy na další zlepšení.cs_CZ
uk.abstract.enThis thesis surveys use of graph theory and algorithms in information retrieval. It provides an introduction to graph and information retrieval theories and an overview of the overlap between these disciplines. We show application of the graph theory in clustering, document classification, finding communities etc. The most stress is, however, put on ranking algorithms as they aim to improve the most critical property of the information retrieval systems, their precision. The paper presents different graphbased ranking algorithms, provides comments to their time and memory requirements and to realistic usage of these rankings. It also contains a description and test results of our implementation of algorithms for computing the PageRank distribution designed for the Egothor search engine.en_US
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
dc.identifier.lisID990008393490106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV