Transformation Robustness in Computer Vision: Invariant &amp; Equivariant Neural Networks

Karella, Tomáš

Robustnost vůči transformacím v počítačovém vidění: invariantní & equivariantní neuronové sítě

dc.contributor.advisor	Blažek, Jan
dc.creator	Karella, Tomáš
dc.date.accessioned	2025-06-19T22:36:22Z
dc.date.available	2025-06-19T22:36:22Z
dc.date.issued	2025
dc.identifier.uri	http://hdl.handle.net/20.500.11956/198701
dc.description.abstract	This Thesis addresses the fundamental challenge of transformation robustness in com- puter vision, focusing on designing neural networks that are inherently invariant to rota- tions and translations. While data augmentation is commonly used to achieve robustness, it lacks mathematical guarantees and requires large amounts of data samples. We build on an alternative approach that embeds transformation robustness directly into the design of neural networks using established group theory principles. This method offers signif- icant advantages, including theoretical guarantees of invariance, reduced computational complexity, improved sampling efficiency, and better generalization to previously unseen transformations. Our major contributions include: (1) two novel neural network archi- tectures that provide end-to-end invariance to rotations and translations, (2) integration of classical hand-crafted features into modern neural networks to enhance transformation robustness, and (3) empirical validation demonstrating improved reliability and efficiency in various computer vision tasks.	en_US
dc.description.abstract	Práce řeší problém robustnosti modelů počítačového vidění vůči transformacím a za- měřuje se na návrh neuronových sítí, které jsou svou architekturou invariantní k rotacím a posunu. Přestože se k dosažení robustnosti běžně využívá data augmentation, tento přístup postrádá matematické záruky a vyžaduje značné množství vzorků. Naše práce rozvíjí alternativní metodu, která je robustní vůči transformacím díky aplikaci poznatků teorie grup do neuronových sítí. Tato metoda přináší řadu výhod: teoretické důkazy invariance, nižší výpočetní náročnost, efektivnější práci se vzorky a lepší generalizaci na neviděné transformace. Naše hlavní přínosy zahrnují: (1) dvě nové architektury neu- ronových sítí zajišťující úplnou invarianci vůči rotacím a posunu, (2) propojení klasick- ých hand-crafted příznaků s moderními neuronovými sítěmi pro zvýšení odolnosti vůči transformacím a (3) empirické ověření prokazující vyšší spolehlivost a účinnost při řešení různých úloh počítačového vidění.	cs_CZ
dc.language	English	cs_CZ
dc.language.iso	en_US
dc.publisher	Univerzita Karlova, Matematicko-fyzikální fakulta	cs_CZ
dc.subject	neural networks\|invariance\|equivariance\|computer vision\|transformation robustness	en_US
dc.subject	neuronové sítě\|invariance\|equivariance\|počítačové vidění\|robustnost vůči transformacím	cs_CZ
dc.title	Transformation Robustness in Computer Vision: Invariant & Equivariant Neural Networks	en_US
dc.type	dizertační práce	cs_CZ
dcterms.created	2025
dcterms.dateAccepted	2025-05-26
dc.description.department	Katedra softwaru a výuky informatiky	cs_CZ
dc.description.department	Department of Software and Computer Science Education	en_US
dc.description.faculty	Matematicko-fyzikální fakulta	cs_CZ
dc.description.faculty	Faculty of Mathematics and Physics	en_US
dc.identifier.repId	272626
dc.title.translated	Robustnost vůči transformacím v počítačovém vidění: invariantní & equivariantní neuronové sítě	cs_CZ
dc.contributor.referee	Bujack, Roxana
dc.contributor.referee	Jiřík, Radovan
thesis.degree.name	Ph.D.
thesis.degree.level	doktorské	cs_CZ
thesis.degree.discipline	Computer Science - Visual computing and computer games	en_US
thesis.degree.discipline	Informatika - Vizuální výpočty a počítačové hry	cs_CZ
thesis.degree.program	Computer Science - Visual computing and computer games	en_US
thesis.degree.program	Informatika - Vizuální výpočty a počítačové hry	cs_CZ
uk.thesis.type	dizertační práce	cs_CZ
uk.taxonomy.organization-cs	Matematicko-fyzikální fakulta::Katedra softwaru a výuky informatiky	cs_CZ
uk.taxonomy.organization-en	Faculty of Mathematics and Physics::Department of Software and Computer Science Education	en_US
uk.faculty-name.cs	Matematicko-fyzikální fakulta	cs_CZ
uk.faculty-name.en	Faculty of Mathematics and Physics	en_US
uk.faculty-abbr.cs	MFF	cs_CZ
uk.degree-discipline.cs	Informatika - Vizuální výpočty a počítačové hry	cs_CZ
uk.degree-discipline.en	Computer Science - Visual computing and computer games	en_US
uk.degree-program.cs	Informatika - Vizuální výpočty a počítačové hry	cs_CZ
uk.degree-program.en	Computer Science - Visual computing and computer games	en_US
thesis.grade.cs	Prospěl/a	cs_CZ
thesis.grade.en	Pass	en_US
uk.abstract.cs	Práce řeší problém robustnosti modelů počítačového vidění vůči transformacím a za- měřuje se na návrh neuronových sítí, které jsou svou architekturou invariantní k rotacím a posunu. Přestože se k dosažení robustnosti běžně využívá data augmentation, tento přístup postrádá matematické záruky a vyžaduje značné množství vzorků. Naše práce rozvíjí alternativní metodu, která je robustní vůči transformacím díky aplikaci poznatků teorie grup do neuronových sítí. Tato metoda přináší řadu výhod: teoretické důkazy invariance, nižší výpočetní náročnost, efektivnější práci se vzorky a lepší generalizaci na neviděné transformace. Naše hlavní přínosy zahrnují: (1) dvě nové architektury neu- ronových sítí zajišťující úplnou invarianci vůči rotacím a posunu, (2) propojení klasick- ých hand-crafted příznaků s moderními neuronovými sítěmi pro zvýšení odolnosti vůči transformacím a (3) empirické ověření prokazující vyšší spolehlivost a účinnost při řešení různých úloh počítačového vidění.	cs_CZ
uk.abstract.en	This Thesis addresses the fundamental challenge of transformation robustness in com- puter vision, focusing on designing neural networks that are inherently invariant to rota- tions and translations. While data augmentation is commonly used to achieve robustness, it lacks mathematical guarantees and requires large amounts of data samples. We build on an alternative approach that embeds transformation robustness directly into the design of neural networks using established group theory principles. This method offers signif- icant advantages, including theoretical guarantees of invariance, reduced computational complexity, improved sampling efficiency, and better generalization to previously unseen transformations. Our major contributions include: (1) two novel neural network archi- tectures that provide end-to-end invariance to rotations and translations, (2) integration of classical hand-crafted features into modern neural networks to enhance transformation robustness, and (3) empirical validation demonstrating improved reliability and efficiency in various computer vision tasks.	en_US
uk.file-availability	P
uk.grantor	Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwaru a výuky informatiky	cs_CZ
thesis.grade.code	P
dc.contributor.consultant	Šikudová, Elena
dc.contributor.consultant	Šroubek, Filip
uk.publication-place	Praha	cs_CZ
dc.date.embargoEndDate	26-05-2030
uk.embargo.reason	Ochrana informací chráněných zvláštním zákonem	cs
uk.embargo.reason	Protection of information protected by a special law	en
uk.thesis.defenceStatus	O

Soubory tohoto záznamu

Název:: 140132546.pdf
Velikost:: 20.48Mb
Formát:: application/pdf
Popis:: Text práce

Zobrazit/otevřít

Název:: 140132539.pdf
Velikost:: 39.24Kb
Formát:: application/pdf
Popis:: Abstrakt

Zobrazit/otevřít

Název:: 140132537.pdf
Velikost:: 39.30Kb
Formát:: application/pdf
Popis:: Abstrakt (anglicky)

Zobrazit/otevřít

Název:: 140132561.zip
Velikost:: 20.26Mb
Formát:: application/zip
Popis:: Příloha práce

Zobrazit/otevřít

Název:: 140133617.pdf
Velikost:: 96.41Kb
Formát:: application/pdf
Popis:: Posudek vedoucího

Zobrazit/otevřít

Název:: 140133757.pdf
Velikost:: 87.53Kb
Formát:: application/pdf
Popis:: Posudek oponenta

Zobrazit/otevřít

Název:: 140133561.pdf
Velikost:: 57.73Kb
Formát:: application/pdf
Popis:: Posudek oponenta

Zobrazit/otevřít

Název:: 140134287.pdf
Velikost:: 352.8Kb
Formát:: application/pdf
Popis:: Záznam o průběhu obhajoby

Zobrazit/otevřít

Tento záznam se objevuje v následujících sbírkách

Kvalifikační práce [11342]
Theses

Zobrazit minimální záznam

Transformation Robustness in Computer Vision: Invariant &amp; Equivariant Neural Networks

Robustnost vůči transformacím v počítačovém vidění: invariantní &amp; equivariantní neuronové sítě

Soubory tohoto záznamu

Tento záznam se objevuje v následujících sbírkách

Transformation Robustness in Computer Vision: Invariant & Equivariant Neural Networks

Robustnost vůči transformacím v počítačovém vidění: invariantní & equivariantní neuronové sítě