Zobrazit minimální záznam

Generation of Czech Lyrics to Cover Songs
dc.contributor.advisorRosa, Rudolf
dc.creatorŠtěpánková, Barbora
dc.date.accessioned2024-07-19T06:23:42Z
dc.date.available2024-07-19T06:23:42Z
dc.date.issued2024
dc.identifier.urihttp://hdl.handle.net/20.500.11956/192043
dc.description.abstractThis thesis explores the topic of generating Czech lyrics to English cover songs. Songs are often adapted to different languages to make them more available to people who do not necessarily speak the language of the original song. During the translation process, however, it is essential to preserve the singability of the text in relation to the melody of the original song, as well as the meaning of the song, so that the translated text fits the context of the original. Currently, such translations are done by hand. We analyze and present the first approaches to solve this problem for Czech through automatic generation using NLP methods. In our work, we create and provide a dataset consisting of pairs of English song lyrics and their official Czech translations. We also provide a dataset of pure Czech song lyrics. We compare the quality of several generative language models. To thoroughly evaluate and analyze their quality, we introduce several automatic metrics and take into account the results of manual evaluation. We find that smaller trained models perform better than larger untrained models. In addition, context is important for the generation of good covers. Finally, we show that our task can be approached from both the translation and generation point of view. 1en_US
dc.description.abstractTato práce se zabývá tvorbou českých textů k anglickým originálním písním. Písně jsou často překládány do různých jazyků, aby byly přístupné i lidem, kteří nerozumějí původnímu jazyku. Během procesu překladu je však nezbytné zachovat zpěvnost textu vzhledem k melodii půvdní písně, stejně tak jako význam písně, aby i přeložený text seděl do kontextu originálu. V současné době se takové překlady provádějí ručně. Provádíme analýzu a představujeme první přístupy k řešení tohoto problému pro češtinu prostřed- nictvím automatického generování pomocí NLP metod. V naší práci vytváříme a poskytu- jeme dataset sestávající se z dvojic Anglických písňových textů a jejich oficiálních Českých překladů. Také poskytujeme dataset z čistě Českých písňových textů. Porovnáváme kval- itu několika generativních jazykových modelů. Pro důkladné zhodnocení a analýzu jejich kvality zavádíme několik automatických metrik a bereme v úvahu i výsledky od lidských hodnotitelů. Zjistili jsme, menší natrénované modely mají lepší výsledky než větší ne- natrénované modely.. Kromě toho je pro kvalitní generování coververzí důležitý kontext. Nakonec ukazujeme, že k našemu úkolu lze přistupovat jak prostřednictvím přístupu založeném na překladu, tak prostřednictvím generativních modelů. 1cs_CZ
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectnatural language processing|text generation|literary NLP|machine translationen_US
dc.subjectzpracování přirozeného jazyka|generování textu|literární NLP|strojový překladcs_CZ
dc.titleGenerování textů českých coververzí anglických písnícs_CZ
dc.typebakalářská prácecs_CZ
dcterms.created2024
dcterms.dateAccepted2024-06-28
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId269769
dc.title.translatedGeneration of Czech Lyrics to Cover Songsen_US
dc.contributor.refereeMareček, David
thesis.degree.nameBc.
thesis.degree.levelbakalářskécs_CZ
thesis.degree.disciplineInformatika se specializací Umělá inteligencecs_CZ
thesis.degree.disciplineComputer Science with specialisation in Artificial Intelligenceen_US
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csInformatika se specializací Umělá inteligencecs_CZ
uk.degree-discipline.enComputer Science with specialisation in Artificial Intelligenceen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTato práce se zabývá tvorbou českých textů k anglickým originálním písním. Písně jsou často překládány do různých jazyků, aby byly přístupné i lidem, kteří nerozumějí původnímu jazyku. Během procesu překladu je však nezbytné zachovat zpěvnost textu vzhledem k melodii půvdní písně, stejně tak jako význam písně, aby i přeložený text seděl do kontextu originálu. V současné době se takové překlady provádějí ručně. Provádíme analýzu a představujeme první přístupy k řešení tohoto problému pro češtinu prostřed- nictvím automatického generování pomocí NLP metod. V naší práci vytváříme a poskytu- jeme dataset sestávající se z dvojic Anglických písňových textů a jejich oficiálních Českých překladů. Také poskytujeme dataset z čistě Českých písňových textů. Porovnáváme kval- itu několika generativních jazykových modelů. Pro důkladné zhodnocení a analýzu jejich kvality zavádíme několik automatických metrik a bereme v úvahu i výsledky od lidských hodnotitelů. Zjistili jsme, menší natrénované modely mají lepší výsledky než větší ne- natrénované modely.. Kromě toho je pro kvalitní generování coververzí důležitý kontext. Nakonec ukazujeme, že k našemu úkolu lze přistupovat jak prostřednictvím přístupu založeném na překladu, tak prostřednictvím generativních modelů. 1cs_CZ
uk.abstract.enThis thesis explores the topic of generating Czech lyrics to English cover songs. Songs are often adapted to different languages to make them more available to people who do not necessarily speak the language of the original song. During the translation process, however, it is essential to preserve the singability of the text in relation to the melody of the original song, as well as the meaning of the song, so that the translated text fits the context of the original. Currently, such translations are done by hand. We analyze and present the first approaches to solve this problem for Czech through automatic generation using NLP methods. In our work, we create and provide a dataset consisting of pairs of English song lyrics and their official Czech translations. We also provide a dataset of pure Czech song lyrics. We compare the quality of several generative language models. To thoroughly evaluate and analyze their quality, we introduce several automatic metrics and take into account the results of manual evaluation. We find that smaller trained models perform better than larger untrained models. In addition, context is important for the generation of good covers. Finally, we show that our task can be approached from both the translation and generation point of view. 1en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV