Zobrazit minimální záznam

Typology of Multiword Expressions in Czech and Frequency of Their Main Features in a Genre-Balanced Corpus
dc.contributor.authorPetkevič, Vladimír
dc.contributor.authorKopřivová, Marie
dc.contributor.authorHnátková, Milena
dc.contributor.authorJelínek, Tomáš
dc.contributor.authorKopřiva, Pavel
dc.contributor.authorRosen, Alexandr
dc.contributor.authorSkoumalová, Hana
dc.contributor.authorVondřička, Pavel
dc.date.accessioned2020-11-05T14:26:05Z
dc.date.available2020-11-05T14:26:05Z
dc.date.issued2020
dc.identifier.issn2336-6702
dc.identifier.urihttp://hdl.handle.net/20.500.11956/123089
dc.language.isocs_CZcs_CZ
dc.publisherUniverzita Karlova, Filozofická fakultacs_CZ
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.0/
dc.sourceStudie z aplikované lingvistiky, 2020, 2, 37-62cs_CZ
dc.source.urihttps://studiezaplikovanelingvistiky.ff.cuni.cz
dc.subjectvíceslovná lexikální jednotka v češtiněcs_CZ
dc.subjecttypologie víceslovných lexikálních jednotekcs_CZ
dc.subjectfrekvence typů víceslovných lexikálních jednotekcs_CZ
dc.subjectidiomaticitacs_CZ
dc.subjectlexikální databázecs_CZ
dc.subjectžánrově vyvážený korpuscs_CZ
dc.titleTypologie víceslovných jednotek v češtině a frekvenční zastoupení jejich hlavních vlastností v žánrově vyváženém korpusucs_CZ
dc.typeVědecký článekcs_CZ
dc.title.translatedTypology of Multiword Expressions in Czech and Frequency of Their Main Features in a Genre-Balanced Corpuscs_CZ
uk.abstract.csPříspěvek má dvě hlavní části: (a) V první části je podrobně popsána typologie (vlastnosti) víceslovných lexikálních jednotek (dále VLJ) v češtině, přičemž tato typologie je součástí popisu databázových hesel těchto jednotek v lexikální databázi LEMUR, obsahující k červnu 2020 více než 10 500 hesel.2 Jednotlivé vlastnosti těchto jednotek jsou zachyceny prostřednictvím kategorií a jejich hodnot. U každé jednotky uvádíme její identifikační lemma a tzv. superlemma, definici, typické příklady; dále popisujeme lemmata a morfologické vlastnosti jednotlivých komponent (slov) a poté takové charakteristiky jako styl/varieta VLJ, její typ užití, syntaktická struktura (včetně reprezentace v podobě závislostního a frázového stromu), aspekty ustálenosti/flexibility (včetně variant a fragmentů VLJ, vnitřní modifikovatelnosti jednotlivých komponent VLJ, možností syntaktických transformací hlavních komponent VLJ a též morfologických omezení) a konečně typy idiomatičnosti na rovině lexikální, morfologické, syntaktické, sémantické a pragmatické. (b) V druhé, hlavní části příspěvku sledujeme frekvenční zastoupení hlavních aspektů této typologie u dosud zpracovaných VLJ: typ užití v korelaci se syntaktickým typem a dále zastoupení různých druhů idiomatičnosti, a to v reálném jazykovém materiálu reprezentovaném žánrově vyváženým korpusem SYN2015 (obsahuje sto milionů slovních tvarů mimo interpunkci). Jde patrně vůbec o první pokus zaměřit se na vlastnosti víceslovných lexikálních jednotek z hlediska četnosti jejich výskytů jakožto typů, nikoli tokenů (tj. četností výskytů dané jednotky).cs_CZ
uk.abstract.enThe paper consists of two main parts: (a) In the first part, a typology of multiword expressions (MWE) in Czech is described in a detailed way. This typology is part of the description of MWE database entries in the lexical database LEMUR containing more than 10,500 MWE entries as of June 2020. MWE properties reflected in this typology are accounted for by categories and their values. Each MWE is identified by a unique lemma; a group of related MWEs is assigned a “superlemma”. A MWE is described by the following properties: a MWE definition, characteristic examples, lemmas and morphological features of MWE components (words), as well as the following key categories: MWE style/register, type of usage, syntactic structure (including its representation by a dependency and a phrase-structure tree), aspects of flexibility (variants and fragments, internal modifiability of individual MWE components, possibilities of syntactic transformations of the main MWE components and morphological constraints) and types of idiomaticity on the lexical, morphological, syntactic, semantic and pragmatic level. (b) In the second part of the paper, the authors focus on the frequency of the main features of the adopted typology in the real language material represented by the genre-balanced SYN2015 corpus, containing 100 mil. word forms (excluding punctuation): a type of usage correlated with a syntactic type and frequency of various kinds of idiomaticity. Our paper seems to be the first attempt at approaching the MWE properties from the point of view of MWE frequencies as types rather than tokens (i.e. frequencies of occurrences of a given MWE).cs_CZ
dc.publisher.publicationPlacePrahacs_CZ
uk.internal-typeuk_publication
dc.description.startPage37
dc.description.endPage62
dcterms.isPartOf.nameStudie z aplikované lingvistikycs_CZ
dcterms.isPartOf.journalYear2020
dcterms.isPartOf.journalVolume2020
dcterms.isPartOf.journalIssue2


Soubory tohoto záznamu

Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam

http://creativecommons.org/licenses/by-nc-nd/2.0/
Kromě případů, kde je uvedeno jinak, licence tohoto záznamu je http://creativecommons.org/licenses/by-nc-nd/2.0/

© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV