Zobrazit minimální záznam

Distant reading of contemporary Czech fiction
dc.contributor.advisorPýcha, Čeněk
dc.creatorPanušková, Charlotte
dc.date.accessioned2024-04-08T11:35:44Z
dc.date.available2024-04-08T11:35:44Z
dc.date.issued2024
dc.identifier.urihttp://hdl.handle.net/20.500.11956/188349
dc.description.abstractThis thesis explores the topic modelling of contemporary Czech prose using LDA and Top2Vec algorithms. It examines how the results of topic modelling correspond to existing knowledge in literary history and further analyses how these findings relate to classical literary theory. The study emphasizes the connection between digital methods of text analysis and traditional literary- historical and theoretical perspectives, offering a new interpretation of modern methods within the literary context. For modelling purposes, the corpus from the Czech National Corpus was used. The corpus was cleaned and divided into three subcorpora based on the publication date of the works. Models of both LDA and Top2Vec algorithms were created from all three subcorpora. To select the most accurate model, the thesis employs the coherence score metric Cv. The results of the models are then compared with present knowledge in literary history. The conclusion underscores that topic modelling serves as an approximation of the literary system rather than a direct means of revealing themes.en_US
dc.description.abstractTato práce se zabývá tematickým modelováním současné české prózy pomocí algoritmů LDA a Top2Vec. Zkoumá, jak výsledky tematického modelování korespondují s dosavadními poznatky literární historie. Dále pak analyzuje, jak se tyto výsledky promítají do klasické literární teorie. Práce tak klade důraz na propojení mezi digitálními metodami analýzy textů a klasickými literárněhistorickými a teoretickými pohledy, čímž přináší nový pohled na interpretaci moderních metod v literárním kontextu. K modelování byl využit veřejně dostupný korpus Českého národního korpusu. Korpus byl pro účely práce očištěn a rozdělen do tří subkorpusů podle data prvního vydání děl. Modely algoritmů LDA a Top2Vec byly vytvořeny ze všech tří subkorpusů. Pro výběr nejpřesnějšího modelu práce využívá metriku skóre koherence Cv. Výsledky modelů jsou následně porovnány s dosavadními poznatky literární historie. Práce na závěr zdůrazňuje, že tematické modelování představuje spíše aproximaci literárního systému než prostředek k přímému odhalování témat.cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Filozofická fakultacs_CZ
dc.subjectvzdálené čtení|digitální literární věda|tematické modelování|digitální humanitní vědy|současná česká prózacs_CZ
dc.subjectdigital literary studies|digital humanitites|topic modelling|contemporary czech fiction|distant readingen_US
dc.titleVzdálené čtení současné české beletriecs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2024
dcterms.dateAccepted2024-01-29
dc.description.departmentInstitute of Information Studies and Librarianship - New Media Studiesen_US
dc.description.departmentÚstav informačních studií - studia nových médiícs_CZ
dc.description.facultyFaculty of Artsen_US
dc.description.facultyFilozofická fakultacs_CZ
dc.identifier.repId260321
dc.title.translatedDistant reading of contemporary Czech fictionen_US
dc.contributor.refereeŠlerka, Josef
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineNew Media Studiesen_US
thesis.degree.disciplineStudia nových médiícs_CZ
thesis.degree.programNew Media Studiesen_US
thesis.degree.programStudia nových médiícs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csFilozofická fakulta::Ústav informačních studií - studia nových médiícs_CZ
uk.taxonomy.organization-enFaculty of Arts::Institute of Information Studies and Librarianship - New Media Studiesen_US
uk.faculty-name.csFilozofická fakultacs_CZ
uk.faculty-name.enFaculty of Artsen_US
uk.faculty-abbr.csFFcs_CZ
uk.degree-discipline.csStudia nových médiícs_CZ
uk.degree-discipline.enNew Media Studiesen_US
uk.degree-program.csStudia nových médiícs_CZ
uk.degree-program.enNew Media Studiesen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTato práce se zabývá tematickým modelováním současné české prózy pomocí algoritmů LDA a Top2Vec. Zkoumá, jak výsledky tematického modelování korespondují s dosavadními poznatky literární historie. Dále pak analyzuje, jak se tyto výsledky promítají do klasické literární teorie. Práce tak klade důraz na propojení mezi digitálními metodami analýzy textů a klasickými literárněhistorickými a teoretickými pohledy, čímž přináší nový pohled na interpretaci moderních metod v literárním kontextu. K modelování byl využit veřejně dostupný korpus Českého národního korpusu. Korpus byl pro účely práce očištěn a rozdělen do tří subkorpusů podle data prvního vydání děl. Modely algoritmů LDA a Top2Vec byly vytvořeny ze všech tří subkorpusů. Pro výběr nejpřesnějšího modelu práce využívá metriku skóre koherence Cv. Výsledky modelů jsou následně porovnány s dosavadními poznatky literární historie. Práce na závěr zdůrazňuje, že tematické modelování představuje spíše aproximaci literárního systému než prostředek k přímému odhalování témat.cs_CZ
uk.abstract.enThis thesis explores the topic modelling of contemporary Czech prose using LDA and Top2Vec algorithms. It examines how the results of topic modelling correspond to existing knowledge in literary history and further analyses how these findings relate to classical literary theory. The study emphasizes the connection between digital methods of text analysis and traditional literary- historical and theoretical perspectives, offering a new interpretation of modern methods within the literary context. For modelling purposes, the corpus from the Czech National Corpus was used. The corpus was cleaned and divided into three subcorpora based on the publication date of the works. Models of both LDA and Top2Vec algorithms were created from all three subcorpora. To select the most accurate model, the thesis employs the coherence score metric Cv. The results of the models are then compared with present knowledge in literary history. The conclusion underscores that topic modelling serves as an approximation of the literary system rather than a direct means of revealing themes.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Filozofická fakulta, Ústav informačních studií - studia nových médiícs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV