Algebraic Structure of R-PolyNets Neural Networks
Algebraická struktura neuronových sítí R-PolyNets
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/199253Identifikátory
SIS: 280780
Kolekce
Autor
Vedoucí práce
Oponent práce
Kohn, Kathlén
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematika pro informační technologie
Katedra / ústav / klinika
Katedra algebry
Datum obhajoby
2. 6. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
Neuronové sítě|Algebraické zobrazení|NeuromanifoldKlíčová slova (anglicky)
Neural networks|Algebraic map|NeuromanifoldV této práci se zaměříme na studium polynomiálních neuronových sítí, zvaných R- PolyNets, s využitím nástrojů z algebraické geometrie. Odvodíme rekurzivní vztah pro zobrazení parametrů, jehož obraz definujeme jako neuromanifold. Jednou z klíčových vlastností neuromanifoldu je jeho dimenze. Představíme jak globální, tak lokální metodu výpočtu dimenze a v případě lokálního výpočtu prostudujeme strukturu Jakobiánů mapy parametrů a jejich skládání v jednotlivých vrstvách. V neposlední řadě dokážeme horní odhad na dimenzi neuromanifoldu a empiricky doložíme jemnější horní mez. Dále výpo- četně ověříme, že zobrazení je zřídkakdy dominantní. Na závěr prostudujeme a dokážeme symetrie generických předobrazů sítě.
In this work, we focus on the study of polynomial neural networks, referred to as R-PolyNets, using tools from algebraic geometry. We derive a recursive relation for the map of parameters, whose image we define as a neuromanifold. One of the key properties of the neuromanifold is its dimension. We present both global and local methods for computing the dimension, and in the local case, we examine the structure and the forward propagation of Jacobians of the parameter map. Furthermore, we establish an upper bound on the dimension of the neuromanifold and empirically demonstrate a finer upper estimate. We also computationally verify that the map is rarely dominant. Finally, we investigate and prove the symmetries of generic preimages of the network.