Zobrazit minimální záznam

Vyhledávání v obrázkových kolekcích na základě lokálních regionů a reprezentací z hlubokých neuronových sítí
dc.contributor.advisorLokoč, Jakub
dc.creatorBátoryová, Jana
dc.date.accessioned2020-10-05T10:10:53Z
dc.date.available2020-10-05T10:10:53Z
dc.date.issued2020
dc.identifier.urihttp://hdl.handle.net/20.500.11956/121009
dc.description.abstractV úlohe "hľadanie známeho objektu" sa zameriavame na nájdenie vopred známeho obrázku v multimediálnej databáze. V tejto práci sa zameriavame na dva prístupy k riešeniu tohto problému, ktoré sú založené na vizuálnej podobnosti s hľadaným obrázkom. V prvom prístupe užívateľ vytvára koláž obrázkov (obrázky získa napríklad z dostupných vyhľadávačov obrázkov). Na základe tejto koláže naše riešenie poskytne užívateľovi prehľad najpodobnejších obrázkov. Z našich výsledkov vyplýva, že spracovanie obrázkov delením do niekoľkých častí je systém schopný poskytnúť lepšie výsledky v porovnaní so systémom, ktorý nezohľadňuje pozíciu obrázkov v koláži, či prístup, ktorý ďalej upravuje vrstvu v neurónovej sieti. Druhá časť našej práce sa zameriava na možnosť vyhľadávania v databáze na základe obrázkov tvári ľudí. V práci ďalej skúmame využitie reprezentácii, vytvorených hlbokými neurónovými sieťami k zotriedeniu tvárí na základe ich podobností. Ďalej prezentujeme jednoduchú štruktúru na prezeranie väčšieho súboru tvárí. Práca zahrňuje program, ktorý prezentuje obe techniky.cs_CZ
dc.description.abstractIn a known-item search task (KIS), the goal is to find a previously seen image in a multimedia collection. In this thesis, we discuss two different approaches based on the visual description of the image. In the first one, the user creates a collage of images (using images from an external search engine), based on which we provide the most similar results from the dataset. Our results show that preprocessing the images in the dataset by splitting them into several parts is a better way to work with the spatial information contained in the user input. We compared the approach to a baseline, which does not utilize this spatial information and an approach that alters a layer in a deep neural network. We also present an alternative approach to the KIS task, search by faces. In this approach, we work with the faces extracted from the images. We investigate face representation for the ability to sort the faces based on their similarity. Then we present a structure that allows easy exploration of the set of faces. We provide a demo, implementing all presented techniques.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectHledání známeho objektucs_CZ
dc.subjectKonvoluční neuronové sítěcs_CZ
dc.subjectVyhledávání obrázků na základě obsahucs_CZ
dc.subjectExplorace multimédiícs_CZ
dc.subjectKnown-item searchen_US
dc.subjectConvolutional neural networken_US
dc.subjectContent-based image retrievalen_US
dc.subjectMultimedia explorationen_US
dc.titleSearching Image Collections Using Deep Representations of Local Regionsen_US
dc.typediplomová prácecs_CZ
dcterms.created2020
dcterms.dateAccepted2020-09-14
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId184282
dc.title.translatedVyhledávání v obrázkových kolekcích na základě lokálních regionů a reprezentací z hlubokých neuronových sítícs_CZ
dc.contributor.refereeFink, Jiří
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineArtificial Intelligenceen_US
thesis.degree.disciplineUmělá inteligencecs_CZ
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csUmělá inteligencecs_CZ
uk.degree-discipline.enArtificial Intelligenceen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVelmi dobřecs_CZ
thesis.grade.enVery gooden_US
uk.abstract.csV úlohe "hľadanie známeho objektu" sa zameriavame na nájdenie vopred známeho obrázku v multimediálnej databáze. V tejto práci sa zameriavame na dva prístupy k riešeniu tohto problému, ktoré sú založené na vizuálnej podobnosti s hľadaným obrázkom. V prvom prístupe užívateľ vytvára koláž obrázkov (obrázky získa napríklad z dostupných vyhľadávačov obrázkov). Na základe tejto koláže naše riešenie poskytne užívateľovi prehľad najpodobnejších obrázkov. Z našich výsledkov vyplýva, že spracovanie obrázkov delením do niekoľkých častí je systém schopný poskytnúť lepšie výsledky v porovnaní so systémom, ktorý nezohľadňuje pozíciu obrázkov v koláži, či prístup, ktorý ďalej upravuje vrstvu v neurónovej sieti. Druhá časť našej práce sa zameriava na možnosť vyhľadávania v databáze na základe obrázkov tvári ľudí. V práci ďalej skúmame využitie reprezentácii, vytvorených hlbokými neurónovými sieťami k zotriedeniu tvárí na základe ich podobností. Ďalej prezentujeme jednoduchú štruktúru na prezeranie väčšieho súboru tvárí. Práca zahrňuje program, ktorý prezentuje obe techniky.cs_CZ
uk.abstract.enIn a known-item search task (KIS), the goal is to find a previously seen image in a multimedia collection. In this thesis, we discuss two different approaches based on the visual description of the image. In the first one, the user creates a collage of images (using images from an external search engine), based on which we provide the most similar results from the dataset. Our results show that preprocessing the images in the dataset by splitting them into several parts is a better way to work with the spatial information contained in the user input. We compared the approach to a baseline, which does not utilize this spatial information and an approach that alters a layer in a deep neural network. We also present an alternative approach to the KIS task, search by faces. In this approach, we work with the faces extracted from the images. We investigate face representation for the ability to sort the faces based on their similarity. Then we present a structure that allows easy exploration of the set of faces. We provide a demo, implementing all presented techniques.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
thesis.grade.code2
uk.publication-placePrahacs_CZ


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2025 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV