Autoregressive action-conditioned 3D human motion synthesis using latent discrete codes
Autoregresivní syntéza lidského 3D pohybu pomocí latentních diskrétních kódů
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/175750Identifikátory
SIS: 247608
Kolekce
- Kvalifikační práce [11216]
Autor
Vedoucí práce
Oponent práce
Mirbauer, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Katedra softwaru a výuky informatiky
Datum obhajoby
7. 9. 2022
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
syntéza pohybu|hluboké učení|diskrétní reprezentace|autoregresivní generováníKlíčová slova (anglicky)
motion synthesis|deep learning|discrete representation|autoregressive generationV této práci jsme představili novou metodu pro syntézu 3D animace pohybu člověka podmíněné na pevné množině akcí definující pohyb, například "běhání" nebo "předklon". Inspirování úspěchy metod pro generování obrázků z textu na základě diskrétních latentních reprezentacích, jsme úspěšně vyzkoušeli použití těchto metod v kontextu generování pohybu, což je v kontrastu s dosavadními příst upy využívající spojité latentní proměnné. Ve srovnání s dosavadní nejlepší metodou ACTOR, naše metoda není limitována délkou generovaných sekvencí a dokáže plynule navázat na vstupní startovní sekvenci. Autoregressivní generování je omezeno délkou kon textu, což zajišťuje rozumnou rychlost generování. Dále, díky učení ve dvou fázích, budoucí modely se mohou snadno pře dučit na větších datasetech bez označení kategorií a dotrénovat se na konkrétním úkolu. Naši metodu jsme vyhodnotili na UESTC dataset, v metriká ch překování dosavadní metodu ACTOR a generuje animace srovnatelné s datasetem.
V této práci jsme představili novou metodu pro syntézu 3D animace pohybu člověka podmíněné na pevné množině akcí definující pohyb, například "běhání" nebo "předklon". Inspirování úspěchy metod pro generování obrázků z textu na základě diskrétních latentních reprezentacích, jsme úspěšně vyzkoušeli použití těchto metod v kontextu generování pohybu, což je v kontrastu s dosavadními příst upy využívající spojité latentní proměnné. Ve srovnání s dosavadní nejlepší metodou ACTOR, naše metoda není limitována délkou generovaných sekvencí a dokáže plynule navázat na vstupní startovní sekvenci. Autoregressivní generování je omezeno délkou kon textu, což zajišťuje rozumnou rychlost generování. Dále, díky učení ve dvou fázích, budoucí modely se mohou snadno pře dučit na větších datasetech bez označení kategorií a dotrénovat se na konkrétním úkolu. Naši metodu jsme vyhodnotili na UESTC dataset, v metriká ch překování dosavadní metodu ACTOR a generuje animace srovnatelné s datasetem.