dc.contributor.advisor | Blažek, Jan | |
dc.creator | Karella, Tomáš | |
dc.date.accessioned | 2025-06-19T22:36:22Z | |
dc.date.available | 2025-06-19T22:36:22Z | |
dc.date.issued | 2025 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/198701 | |
dc.description.abstract | This Thesis addresses the fundamental challenge of transformation robustness in com- puter vision, focusing on designing neural networks that are inherently invariant to rota- tions and translations. While data augmentation is commonly used to achieve robustness, it lacks mathematical guarantees and requires large amounts of data samples. We build on an alternative approach that embeds transformation robustness directly into the design of neural networks using established group theory principles. This method offers signif- icant advantages, including theoretical guarantees of invariance, reduced computational complexity, improved sampling efficiency, and better generalization to previously unseen transformations. Our major contributions include: (1) two novel neural network archi- tectures that provide end-to-end invariance to rotations and translations, (2) integration of classical hand-crafted features into modern neural networks to enhance transformation robustness, and (3) empirical validation demonstrating improved reliability and efficiency in various computer vision tasks. | en_US |
dc.description.abstract | Práce řeší problém robustnosti modelů počítačového vidění vůči transformacím a za- měřuje se na návrh neuronových sítí, které jsou svou architekturou invariantní k rotacím a posunu. Přestože se k dosažení robustnosti běžně využívá data augmentation, tento přístup postrádá matematické záruky a vyžaduje značné množství vzorků. Naše práce rozvíjí alternativní metodu, která je robustní vůči transformacím díky aplikaci poznatků teorie grup do neuronových sítí. Tato metoda přináší řadu výhod: teoretické důkazy invariance, nižší výpočetní náročnost, efektivnější práci se vzorky a lepší generalizaci na neviděné transformace. Naše hlavní přínosy zahrnují: (1) dvě nové architektury neu- ronových sítí zajišťující úplnou invarianci vůči rotacím a posunu, (2) propojení klasick- ých hand-crafted příznaků s moderními neuronovými sítěmi pro zvýšení odolnosti vůči transformacím a (3) empirické ověření prokazující vyšší spolehlivost a účinnost při řešení různých úloh počítačového vidění. | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | neural networks|invariance|equivariance|computer vision|transformation robustness | en_US |
dc.subject | neuronové sítě|invariance|equivariance|počítačové vidění|robustnost vůči transformacím | cs_CZ |
dc.title | Transformation Robustness in Computer Vision: Invariant & Equivariant Neural Networks | en_US |
dc.type | dizertační práce | cs_CZ |
dcterms.created | 2025 | |
dcterms.dateAccepted | 2025-05-26 | |
dc.description.department | Katedra softwaru a výuky informatiky | cs_CZ |
dc.description.department | Department of Software and Computer Science Education | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 272626 | |
dc.title.translated | Robustnost vůči transformacím v počítačovém vidění: invariantní & equivariantní neuronové sítě | cs_CZ |
dc.contributor.referee | Bujack, Roxana | |
dc.contributor.referee | Jiřík, Radovan | |
thesis.degree.name | Ph.D. | |
thesis.degree.level | doktorské | cs_CZ |
thesis.degree.discipline | Computer Science - Visual computing and computer games | en_US |
thesis.degree.discipline | Informatika - Vizuální výpočty a počítačové hry | cs_CZ |
thesis.degree.program | Computer Science - Visual computing and computer games | en_US |
thesis.degree.program | Informatika - Vizuální výpočty a počítačové hry | cs_CZ |
uk.thesis.type | dizertační práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwaru a výuky informatiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software and Computer Science Education | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika - Vizuální výpočty a počítačové hry | cs_CZ |
uk.degree-discipline.en | Computer Science - Visual computing and computer games | en_US |
uk.degree-program.cs | Informatika - Vizuální výpočty a počítačové hry | cs_CZ |
uk.degree-program.en | Computer Science - Visual computing and computer games | en_US |
thesis.grade.cs | Prospěl/a | cs_CZ |
thesis.grade.en | Pass | en_US |
uk.abstract.cs | Práce řeší problém robustnosti modelů počítačového vidění vůči transformacím a za- měřuje se na návrh neuronových sítí, které jsou svou architekturou invariantní k rotacím a posunu. Přestože se k dosažení robustnosti běžně využívá data augmentation, tento přístup postrádá matematické záruky a vyžaduje značné množství vzorků. Naše práce rozvíjí alternativní metodu, která je robustní vůči transformacím díky aplikaci poznatků teorie grup do neuronových sítí. Tato metoda přináší řadu výhod: teoretické důkazy invariance, nižší výpočetní náročnost, efektivnější práci se vzorky a lepší generalizaci na neviděné transformace. Naše hlavní přínosy zahrnují: (1) dvě nové architektury neu- ronových sítí zajišťující úplnou invarianci vůči rotacím a posunu, (2) propojení klasick- ých hand-crafted příznaků s moderními neuronovými sítěmi pro zvýšení odolnosti vůči transformacím a (3) empirické ověření prokazující vyšší spolehlivost a účinnost při řešení různých úloh počítačového vidění. | cs_CZ |
uk.abstract.en | This Thesis addresses the fundamental challenge of transformation robustness in com- puter vision, focusing on designing neural networks that are inherently invariant to rota- tions and translations. While data augmentation is commonly used to achieve robustness, it lacks mathematical guarantees and requires large amounts of data samples. We build on an alternative approach that embeds transformation robustness directly into the design of neural networks using established group theory principles. This method offers signif- icant advantages, including theoretical guarantees of invariance, reduced computational complexity, improved sampling efficiency, and better generalization to previously unseen transformations. Our major contributions include: (1) two novel neural network archi- tectures that provide end-to-end invariance to rotations and translations, (2) integration of classical hand-crafted features into modern neural networks to enhance transformation robustness, and (3) empirical validation demonstrating improved reliability and efficiency in various computer vision tasks. | en_US |
uk.file-availability | P | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwaru a výuky informatiky | cs_CZ |
thesis.grade.code | P | |
dc.contributor.consultant | Šikudová, Elena | |
dc.contributor.consultant | Šroubek, Filip | |
uk.publication-place | Praha | cs_CZ |
dc.date.embargoEndDate | 26-05-2030 | |
uk.embargo.reason | Ochrana informací chráněných zvláštním zákonem | cs |
uk.embargo.reason | Protection of information protected by a special law | en |
uk.thesis.defenceStatus | O | |