dc.contributor.advisor | Kvapilíková, Ivana | |
dc.creator | Černý, Jan | |
dc.date.accessioned | 2025-07-11T09:02:52Z | |
dc.date.available | 2025-07-11T09:02:52Z | |
dc.date.issued | 2025 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/200780 | |
dc.description.abstract | Tato práce kombinuje zpracování přirozeného jazyka a vizualizaci textu prostřednic- tvím inovativního konceptu "text glittering". Ten je inspirován statistickými metodami popsanými v článku "GLTR: Statistical Detection and Visualization of Generated Text" od Sebastiana Gehrmanna, Hendrika Strobelta a Alexandera M. Rushe (2019). Výzkum se zabývá čitelností a informativností textu, aby se předešlo nedorozuměním, zejména v právním kontextu. S využitím technik jako jsou jazykové modely a aproximace informační entropie práce zachycuje vývoj nástroje pro vizuální reprezentaci a hodnocení čitelnosti textu. Získané poznatky přispívají do oblasti zpracování přirozeného jazyka a nabízejí praktické využití pro zlepšení srozumitelnosti textu. | cs_CZ |
dc.description.abstract | This thesis explores the intersection of natural language processing and text visual- ization through the innovative concept of "text glittering". It is inspired by the statistical detection methods outlined in the paper "GLTR: Statistical Detection and Visualization of Generated Text" by Sebastian Gehrmann, Hendrik Strobelt and Alexander M. Rush (2019). The research addresses the challenges of readability and information preserva- tion, highlighting the importance of clear communication to prevent misunderstandings, particularly in legal contexts. By employing techniques such as language modeling and information entropy approximation, the thesis develops a visual representation tool and an assessment of the readability of a text. The findings contribute to natural language processing and offer practical applications to improve text clarity and engagement. | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | Natural language processing|Transformers|GPT|Lexical surprise|Information entropy|Text comprehension|Computational linguistics | en_US |
dc.subject | Zpracování přirozeného jazyka|Transformery|GPT|Lexikální překvapení|Informační entropie|Porozumitelnost textu|Výpočetní lingvistika | cs_CZ |
dc.title | Measuring lexical surprisal in legal texts | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2025 | |
dcterms.dateAccepted | 2025-06-20 | |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 270420 | |
dc.title.translated | Měření lexikálního překvapení v právních textech | cs_CZ |
dc.contributor.referee | Hajič, Jan | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Computer Science with specialisation in Artificial Intelligence | en_US |
thesis.degree.discipline | Informatika se specializací Umělá inteligence | cs_CZ |
thesis.degree.program | Informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika se specializací Umělá inteligence | cs_CZ |
uk.degree-discipline.en | Computer Science with specialisation in Artificial Intelligence | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Tato práce kombinuje zpracování přirozeného jazyka a vizualizaci textu prostřednic- tvím inovativního konceptu "text glittering". Ten je inspirován statistickými metodami popsanými v článku "GLTR: Statistical Detection and Visualization of Generated Text" od Sebastiana Gehrmanna, Hendrika Strobelta a Alexandera M. Rushe (2019). Výzkum se zabývá čitelností a informativností textu, aby se předešlo nedorozuměním, zejména v právním kontextu. S využitím technik jako jsou jazykové modely a aproximace informační entropie práce zachycuje vývoj nástroje pro vizuální reprezentaci a hodnocení čitelnosti textu. Získané poznatky přispívají do oblasti zpracování přirozeného jazyka a nabízejí praktické využití pro zlepšení srozumitelnosti textu. | cs_CZ |
uk.abstract.en | This thesis explores the intersection of natural language processing and text visual- ization through the innovative concept of "text glittering". It is inspired by the statistical detection methods outlined in the paper "GLTR: Statistical Detection and Visualization of Generated Text" by Sebastian Gehrmann, Hendrik Strobelt and Alexander M. Rush (2019). The research addresses the challenges of readability and information preserva- tion, highlighting the importance of clear communication to prevent misunderstandings, particularly in legal contexts. By employing techniques such as language modeling and information entropy approximation, the thesis develops a visual representation tool and an assessment of the readability of a text. The findings contribute to natural language processing and offer practical applications to improve text clarity and engagement. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |