Gender Associations in the Czech Lexicon and Their Impact on Language Processing
Genderové asociace v české slovní zásobě a jejich vliv na zpracování jazyka
dizertační práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/199705Identifikátory
SIS: 228326
Kolekce
- Kvalifikační práce [24310]
Autor
Vedoucí práce
Oponent práce
Šimík, Radek
Keuleers, Emmanuel
Fakulta / součást
Filozofická fakulta
Obor
Český jazyk
Katedra / ústav / klinika
Ústav českého jazyka a teorie komunikace
Datum obhajoby
3. 6. 2025
Nakladatel
Univerzita Karlova, Filozofická fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
lexikální normy|genderové asociace|jmenný rod|generické maskulinumKlíčová slova (anglicky)
lexical norms|gender associations|grammatical gender|masculine genericsHlavním cílem této práce je prozkoumat možnosti využití lexikálních norem ve výzkumu jazyka a genderu. V posledních letech bylo publikováno několik souborů dat obsahujících hodnocení tisíců slovních významů z hlediska genderových asociací (např. Scott et al., 2019; Vankrunkelsven et al., 2024). Tato data se ukázala být cenná jednak jako zdroj kontrolovaných stimulů v experimentálních studiích, jednak jako validovaný zdroj údajů v observačním výzkumu. Samotné genderové normy však dosud nebyly důkladně prozkoumány, aby bylo možné identifikovat potenciálně nežádoucí faktory, které hodnocení ovlivňují. Hlubší explorace by také mohla přinést poznatky o sémantické struktuře genderových asociací a vést k formulaci nových výzkumných otázek. Tato práce má zacíl tuto mezeru zaplnit a prozkoumat hodnocení ze souboru dat Sociolex, který zachycuje genderové asociace pro 3,000 významů českých slov (Preininger et al., in prep). Druhá kapitola představuje data ze sady Sociolex, popisuje metodologii studie a distribuci hodnocení. Ačkoli se soubor dat ukázal být kvalitní, analýzy ukazují, že hodnocení genderových asociací je systematicky ovlivňováno různými faktory - především jmenným rodem, který ovlivnil asociace dokonce i u neživotných podstatných jmen. Třetí kapitola porovnává hodnocení genderových asociací s dalšími...
The overarching aim of this thesis is to examine how human ratings of word meanings can be used in research on language and gender. In recent years, multiple datasets containing human judgments on gender associations for thousands of word meanings have been published (e.g., Scott et al., 2019; Vankrukelsven et al., 2024). These norming datasets have proven valuable both as sources of controlled stimuli in experimental studies and as information resources in observational research. However, gender norms themselves have yet to be thoroughly examined to identify potential confounding factors that may influence the actual ratings. A deeper exploration could also reveal insights into the semantic structure of gender associations and inspire new research questions. This thesis addresses this gap by analyzing gender ratings from the Sociolex dataset, which captures gender associations for 3,000 Czech word meanings (Preininger et al., submitted). Chapter 2 introduces the Sociolex norms, describing their methodology and distribution of the ratings. While the dataset was shown to be of high quality, analyses reveal that gender ratings are systematically influenced by various factors - most notably, grammatical gender, which is highly pervasive in the grammar of Czech and affects associations even for inanimate nouns...