Obsah a značkování diachronního korpusu češtiny
The Content and Annotation of the Diachronic Corpus of Czech
Vědecký článek
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/96551Identifikátory
Kolekce
- Číslo 1 [8]
Datum vydání
2015Nakladatel
Univerzita Karlova, Filozofická fakultaPraha
Zdrojový dokument
Časopis pro moderní filologii (Journal for Modern Philology) (web)ISSN: 2336-6591
Rok vydání periodika: 2015
Ročník periodika: 2015
Číslo periodika: 1
Odkaz na licenční podmínky
https://creativecommons.org/licenses/by-nc-nd/2.0/Klíčová slova (česky)
diachronní korpus, korpusový manažer, vertikální text, frekvenceKlíčová slova (anglicky)
diachronic corpus, corpus manager, vertical format, frequencyThe paper discusses what kind of content and annotation should be included in the diachronic corpus of Old Czech. Based on his analysis of the current state of DIAKORP and the Old Czech Text Bank the author suggests solutions for how to treat the critical apparatus, foreign words in historical Czech texts and contemporaneous or later marginal or interlinear notes. He also discusses some aspects of the methodology of statistics computation in the diachronic corpus.