Generování českých poetických slok a jejich evaluace
Generation of Czech poetic strophes and their evaluation
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/190611Identifikátory
SIS: 266468
Kolekce
- Kvalifikační práce [11214]
Autor
Vedoucí práce
Konzultant práce
Musil, Tomáš
Oponent práce
Popel, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
10. 6. 2024
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
česká poezie|zpracování přirozeného jazyka|neuronové sítě|automatická evaluaceKlíčová slova (anglicky)
Czech poetry|natural language processing|neural networks|automatic evaluationV současné době jsou velké jazykové modely stále úspěšnější v otevřené doméně a jsou schopny interagovat ve velkém množství úloh. Úlohy a jazyky řidčeji zastoupené v datech, takový úspěch ale nemají. Ještě horší výsledky lze pozorovat u úloh, které jsou zaměřeny na nesémantické aspekty textu. Takovou úlohou je, jak bylo pozorováno, česká poezie. Poezie zahrnuje nestandardní aspekty, jako je fonetika a rýmování, které se obvykle ne- zohledňují. Její následná kombinace s českým jazykem, který není v trénovacích datech výrazně zastoupen, vytváří prostředí pro modely neznámé. Byla proto vyvinuta snaha zavést takový model, který by tuto problematiku českého básnického textu uspokojil. 1
Currently, Large Language Models are increasingly more successfully in open domain, being able to interact in a large number of tasks. But tasks and languages more sparsely represented in data the models where trained on do not enjoy such success. Even worse performance can be observed on tasks that are aimed at non-semantic aspects of text. Czech poetry is observed to be such task, as it involves non-standard aspects like phonetics and rhyming, which are usually not accounted for, in a language that is not common. Effort was therefore done to introduce such a model that could satisfy this problem of Czech poetic text. 1