Discourse relations of the Prague Discourse Treebank in Universal Dependencies
Diskurzní vztahy Pražského diskurzního korpusu v Universal Dependencies
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/200828Identifikátory
SIS: 277862
Kolekce
- Kvalifikační práce [11976]
Autor
Vedoucí práce
Konzultant práce
Poláková, Lucie
Oponent práce
Kuboň, Vladislav
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
20. 6. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
diskurzní vztahy|Universal Dependencies|strojové učeníKlíčová slova (anglicky)
discourse relations|Universal Dependencies|machine learningTato diplomová práce navrhuje nový přístup k integraci anotace diskurzních vztahů Prague Discourse Treebanku do rámce Universal Dependencies. Spojením anotací PDiT transformovaných do formátu podobného PDTB se syntaktickými daty UD generovanými pomocí UDPipe jsme vytvořili jednotnou reprezentaci, která spojuje diskurzní vztahy s jejich odpovídajícími syntaktickými strukturami. Následně jsme provedli experimenty strojového učení v klasifikaci diskurzních typů s využitím tohoto nového formátu, při nichž jsme hodnotili příspěvky jednotlivých rysů a výkon modelů, zdůraznili jsme výhody a výzvy navrhovaného přístupu a položili základy pro další pokroky v automatické analýze diskurzu1 . 1 Tato česká verze abstraktu byla přeložená z anglického abstraktu pomocí strojového překladu s ručními úpravami.
This thesis introduces a novel approach for integrating discourse relation annotations from the Prague Discourse Treebank into the Universal Dependencies framework. By aligning PDiT annotations transformed into a PDTB-like format with UD's syntactic data generated by UDPipe, we have created a unified representation that links discourse relations to their corresponding syntactic structures. We then conducted machine learn- ing experiments in discourse type classification using this new format, evaluating feature contribution and performance, highlighting the benefits and challenges of the proposed approach and paving the way for further advancements in computational discourse anal- ysis.
