Algorithmic game theory and machine learning
Algoritmická teorie her a strojové učení
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/206003Identifikátory
SIS: 232442
Kolekce
- Kvalifikační práce [11979]
Autor
Vedoucí práce
Konzultant práce
Schmid, Martin
Oponent práce
Celli, Andrea
Kroupa, Tomáš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - teorie, diskrétní modely a optimalizace
Katedra / ústav / klinika
Katedra aplikované matematiky
Datum obhajoby
20. 11. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
teorie her|strojové učení|distribuční system|mechanism designKlíčová slova (anglicky)
game theory|machine learning|distribution system|market|mechanism designTato práce popisuje dva nové modely kombinující teorii her a vícehráčové učení. Nejdříve popíšeme přímočaré rozšíření volného trhu, jehož cílem je upřednostnit féro- vost v distribuci nedostatkové komodity. Ve zjednodušených případech ukazujeme, že náš systém tohoto dosáhne, a empiricky demonstrujeme jeho obecnost. V druhé části práce popisujeme přístup metaučících algoritmů pro minimalizaci regretu. Náš model apliku- jeme v doméně her dvou hráčů s nulovým součtem a při aproximaci Nashovy rovnováhy v obecných hrách. V obou případech dosahujeme výsledků převyšujících stávající nejlepší algoritmy, a to na hrách, pro které byly tyto algoritmy navrženy.
In this thesis we study two frameworks which combine game theory and multi-agent learning. The first describes an extension of the free market, designed to promote fair allocation of scarce resources. We prove theoretically the system achieves the goal in restricted settings, and demonstrate its generality empirically. In the second part, we describe a meta-learning framework over regret minimization algorithms. We use our approach to accelerate convergence to equilibrium in two-player zero-sum games, and to approximate Nash equilibra in general-sum games. In both cases, we outperform state- of-the-art algorithms on the domains they were designed to excel at.
