Methods of determination of base pairs in nucleic acids
Metody stanovení párů bazí v nukleových kyselinách
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/194083Identifikátory
SIS: 258412
Kolekce
- Kvalifikační práce [20319]
Autor
Vedoucí práce
Oponent práce
Hoksza, David
Fakulta / součást
Přírodovědecká fakulta
Obor
Bioinformatika
Katedra / ústav / klinika
Katedra buněčné biologie
Datum obhajoby
9. 9. 2024
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
molekulární struktura, nukleové kyseliny, RNA, DNA, párování bází, nekanonické páry, strukturní databázeKlíčová slova (anglicky)
molecular structure, nucleic acids, RNA, DNA, base pairing, non-canonical base pairs, structural databases(česky) Struktura nukleových kyselin je do značné míry určena párovými interakcemi mezi bázemi nukleotidů. Nejvýznamější jsou "Watson-Crickovské A-T a G-C páry, které kódují genetickou informaci. Tyto páry, které se někdy nazývají kanonické, jsou nejpočetnějším typem párů jak v DNA, tak v RNA. Kromě kanonických párů existuje ale několik desítek jiných možných geometrických uspořádání párů bazí. Na začátku tisíciletí Leontis a Westhof definovali elegantní, univerzální a dnes široce používaný klasifikační systém párování. Dnes dostupné programy ale klasifikují páry nekompletně, často nespávně a výsledky přiřazení párů jsou mezi programy nekonzistentní. V této práci představujeme konzistentní systém geometrických parametrů, pomocí kterých lze všechny třídy párů univerzálně definovat. Tyto parametry nám umožňují automaticky hledat páry v molekulárních strukturách. Součástí práce je referenční implementace výpočtu těchto parametrů z prostorových struktur načtených z archvního formátu mmCIF nebo i ze staršího formátu PDB. Dále jsme vyvinuli veřejně dostupnou webovou aplikaci, která umožňuje interaktivně prohledávat páry z celé databáze PDB. Díky této aplikaci jsme stanovili robustní limity distribucí parametrů, které definují jednotlivé třídy párů. Klíčová slova: molecular structure, nucleic acids, RNA,...
(English) Structures of nucleic acids are largely determined by pairwise interactions between nucleotide bases. The most important are the widely known "Watson-Crick" G-C and A-T pairs, which encode genetic information. These pairs, sometimes called canonical, are the most abundant pairs in both DNA and RNA. In addition to canonical pairs, there are several dozen other possible geometrical arrangements of base pairs. Over two decades ago, Leontis and Westhof defined an elegant, universal and today widely used pairing classification system. However, currently available computer programs classify pairs incompletely, and the basepair assignment is inconsistent between programs. In this work, we present a universal system of geometric parameters by which all basepair classes can be formally defined. These parameters allow us to automatically search for pairs in molecular structures. This work includes a reference implementation of algorithms calculating the parameters from spatial structures read from the mmCIF or PDB archive formats. Furthermore, we developed a publicly available web application that allows interactively searching basepairs from the entire PDB database. Thanks to this application, we have established robust limits on the parameter distributions that define individual basepair classes....