Genetický kód je soubor pravidel, podle kterých se v živých buňkách převádí sekvence nukleotidů ( genů a mRNA ) na sekvenci aminokyselin ( proteinů ). Vlastní translaci ( translaci ) provádí ribozom , který spojuje aminokyseliny do řetězce podle instrukcí zapsaných v kodonech mRNA . Odpovídající aminokyseliny jsou dodávány do ribozomu molekulami tRNA . Genetický kód všech živých organismů na Zemi je stejný (existují pouze drobné odchylky), což naznačuje přítomnost společného předka .
Pravidla genetického kódu určují, která aminokyselina odpovídá tripletu (třem po sobě jdoucím nukleotidům) v mRNA. Až na vzácné výjimky [1] každý kodon odpovídá pouze jedné aminokyselině. Konkrétní aminokyselina může být kódována více než jedním kodonem a existují také kodony, které označují začátek a konec proteinu. Varianta genetického kódu, kterou používá velká většina živých organismů, se nazývá standardní neboli kanonický genetický kód. Je však známo několik desítek výjimek ze standardního genetického kódu, například při překladu v mitochondriích se používají mírně upravená pravidla genetického kódu.
Nejjednodušší reprezentací genetického kódu je tabulka 64 buněk, ve které každá buňka odpovídá jednomu z 64 možných kodonů [2] .
Pokusy pochopit, jak sekvence DNA kóduje aminokyselinovou sekvenci proteinů, začaly téměř okamžitě poté, co byla v roce 1953 založena struktura DNA ( dvojšroubovice Georgy Gamow navrhl, že kodony by se měly skládat ze tří nukleotidů, aby bylo dostatek kodonů pro všech 20 aminokyselin (celkem je možných 64 různých kodonů o třech nukleotidech: jeden ze čtyř nukleotidů lze umístit do každé ze tří pozic) [3 ] .
V roce 1961 byla experimentálně potvrzena tripletní povaha genetického kódu. Ve stejném roce Marshall Nirenberg a jeho kolega Heinrich Mattei použili bezbuněčný systém pro in vitro translaci . Oligonukleotid sestávající z uracilových zbytků (UUUU...) byl vzat jako templát . Z něj syntetizovaný peptid obsahoval pouze aminokyselinu fenylalanin [4] . Takže význam kodonu byl poprvé stanoven: kodon UUU kóduje fenylalanin. Další pravidla pro korespondenci mezi kodony a aminokyselinami byla stanovena v laboratoři Severo Ochoa . Bylo prokázáno, že polyadeninová RNA (AAA...) je translatována na polylysinový peptid [5] a peptid sestávající pouze z prolinových zbytků je syntetizován na templátu polycytosinové RNA (CCC...) [6] . Význam zbývajících kodonů byl stanoven pomocí různých kopolymerů v průběhu experimentů prováděných v laboratoři Hara Gobind Qur'an . Krátce poté Robert Holley stanovil strukturu molekuly tRNA, která zprostředkovává translaci. V roce 1968 byli Nirenberg, Korana a Holly oceněni Nobelovou cenou za fyziologii a medicínu [7] .
Po stanovení pravidel genetického kódu jej mnozí vědci začali uměle přetvářet . Takže od roku 2001 bylo do genetického kódu zavedeno 40 aminokyselin, které v přírodě nejsou součástí bílkovin. Pro každou aminokyselinu byl vytvořen její vlastní kodon a odpovídající aminoacyl-tRNA syntetáza . Umělá expanze genetického kódu a tvorba proteinů s novými aminokyselinami může pomoci k hlubšímu studiu struktury molekul proteinů a také k získání umělých proteinů s požadovanými vlastnostmi [8] [9] . H. Murakami a M. Sishido dokázali přeměnit některé kodony ze tří nukleotidů na čtyři a pět nukleotidů. Stephen Brenner obdržel 65. kodon, který byl funkční in vivo [10] .
Bakterii Escherichia coli se v roce 2015 podařilo změnit hodnotu všech kodonů UGG z tryptofanu na thienopyrrol-alanin, který se v přírodě nenachází [11] . V roce 2016 byl získán první polosyntetický organismus — bakterie, jejíž genom obsahoval dvě umělé dusíkaté báze (X a Y), které jsou zachovány při dělení [12] [13] . V roce 2017 oznámili vědci z Jižní Koreje vytvoření myši s rozšířeným genetickým kódem, schopné syntetizovat proteiny s aminokyselinami, které se v přírodě nenacházejí [14] .
Geny jsou kódovány ve směru 5'→3' nukleotidové sekvence [15] . Čtecí rámec je určen úplně prvním tripletem, od kterého začíná překlad. Sekvence nepřekrývajících se kodonů začínající start kodonem a končící stop kodonem se nazývá otevřený čtecí rámec . Například sekvence 5'-AAATGAACG-3' (viz obr.) při čtení z prvního nukleotidu je rozdělena na kodony AAA, TGA a ACG. Pokud čtení začíná od druhého nukleotidu, pak mu odpovídají kodony AAT a GAA. Nakonec se při čtení ze třetího nukleotidu použijí kodony ATG a AAC. Jakákoli sekvence tedy může být čtena ve směru 5' → 3' třemi různými způsoby (se třemi různými čtecími rámci) a v každém případě se sekvence proteinového produktu bude lišit v důsledku rozpoznání různých kodonů ribozomem. Pokud vezmeme v úvahu, že DNA má dvouřetězcovou strukturu, pak je možných 6 čtecích rámců: tři na jednom řetězci a tři na druhém [16] . Čtení genů z DNA však není náhodné. Všechny ostatní čtecí rámce v rámci jednoho genu obvykle obsahují četné stop kodony pro rychlé zastavení a snížení metabolických nákladů na chybnou syntézu [17] .
Překlad informace ze sekvence mRNA do sekvence aminokyselin začíná tzv. start kodonem – obvykle AUG, a u eukaryot se čte jako methionin au bakterií jako formylmethionin . Jeden start kodon nestačí k zahájení translace; vyžaduje translační iniciační faktory , stejně jako speciální prvky v sousedních sekvencích, jako je Shine-Dalgarnova sekvence v bakteriích. V některých organismech se jako startovací kodony používají kodony GUG, který normálně kóduje valin , a UUG, který ve standardním kódu odpovídá leucinu [18] .
Po iniciačním kodonu pokračuje translace sekvenčním čtením kodonů a připojováním aminokyselin k sobě navzájem ribozomem, dokud není dosaženo stop kodonu pro zastavení translace. Existují tři stop kodony, každý s jiným názvem: UAG (jantarová), UGA (opálová) a UAA (okrová). Stop kodony se také nazývají terminátory. V buňkách neexistují žádné tRNA odpovídající stop kodonům, a proto, když ribozom dosáhne stop kodonu, místo tRNA s ním interagují translační terminační faktory, které hydrolyzují poslední tRNA z aminokyselinového řetězce a pak nutí ribozom disociovat [19] . U bakterií se na terminaci translace účastní tři proteinové faktory : RF-1, RF-2 a RF-3: RF-1 rozpoznává kodony UAG a UAA a RF-2 rozpoznává UAA a UGA. Faktor RF-3 vykonává doplňkovou práci. Trojrozměrná struktura RF-1 a RF-2 připomíná tvar a distribuci náboje tRNA a představuje tak příklad molekulární mimikry [20] . U eukaryot rozpozná translační terminační faktor eRF1 všechny tři stop kodony. Ribozomově závislá GTPáza eRF3, která je považována za druhý eukaryotický translační terminační faktor, pomáhá eRF1 při uvolňování hotového polypeptidu z ribozomu [21] [22] [23] .
Distribuce stop kodonů v genomu organismu není náhodná a může být spojena s GC složením genomu [24] [25] . Například kmen E. coli K-12 má ve svém genomu 2705 TAA (63 %), 1257 TGA (29 %) a 326 TAG (8 %) kodonů s obsahem GC 50,8 % [26] . Rozsáhlá studie genomů různých bakteriálních druhů ukázala, že podíl kodonu TAA pozitivně koreluje se složením GC, zatímco podíl TGA koreluje negativně. Frekvence nejvzácněji používaného stop kodonu, TAG, není spojena se složením GC [27] . Síla stop kodonů se také liší. Spontánní ukončení translace se nejčastěji vyskytuje na kodonu UGA a nejméně často na UAA [23] .
Kromě samotného stop kodonu má pro ukončení translace prvořadý význam jeho prostředí. Role nukleotidu umístěného bezprostředně za stop kodonem (+4) je největší. Je pravděpodobné, že nukleotid +4 a další nukleotidy po něm ovlivňují terminaci translace tím, že poskytují vazebná místa pro faktory terminace translace. Z tohoto důvodu někteří výzkumníci navrhují zvážit čtyřnukleotidový stop signál namísto třínukleotidového stop kodonu. Nukleotidy upstream od stop kodonů také ovlivňují translaci. Například u kvasinek bylo prokázáno, že adenin umístěný 2 pozice upstream od nukleotidu prvního stop kodonu stimuluje terminaci translace na stop kodonu UAG (možná také na jiných kodonech) [23] .
Někdy stop kodony fungují jako smyslové kodony. Například kodon UGA kóduje nestandardní aminokyselinu selenocystein , pokud se vedle něj v transkriptu nachází takzvaný prvek SECIS [28] . Stop kodon UAG může kódovat další nestandardní aminokyselinu, pyrrolysin . Někdy je stop kodon rozpoznán jako sense kodon v mutacích, které ovlivňují tRNA. Tento jev je nejčastěji pozorován u virů , ale byl popsán také u bakterií, kvasinek , drozofil a lidí, kde hraje regulační roli [29] [30] .
V průběhu replikace DNA se občas vyskytují chyby při syntéze dceřiného řetězce. Tyto chyby, nazývané mutace , mohou ovlivnit fenotyp organismu, zvláště pokud ovlivňují kódující oblast genu. Chyby se vyskytují rychlostí 1 z každých 10–100 milionů párů bází (bp), protože DNA polymerázy mohou účinně korigovat jejich chyby [31] [32] .
Bodové mutace jsou jednotlivé substituce jedné dusíkaté báze. Pokud nová báze patří do stejné třídy jako původní (oba puriny nebo oba pyrimidiny ), pak se mutace označuje jako přechody . Pokud je purin nahrazen pyrimidinem nebo pyrimidin purinem, mluví se o transverzích . Přechody jsou častější než transverze [33] . Příklady bodových mutací jsou missense a nesmyslné mutace . Mohou způsobit onemocnění, jako je srpkovitá anémie a talasémie [34] [35] . Klinicky významné missense mutace vedou k nahrazení aminokyselinového zbytku zbytkem s odlišnými fyzikálně-chemickými vlastnostmi a nesmyslné mutace vedou ke vzniku předčasného stop kodonu [16] .
Mutace, u kterých je narušen správný čtecí rámec v důsledku inzercí a delecí (souhrnně se nazývají indels ) obsahujících nenásobek tří nukleotidů, se nazývají mutace posunu čtecího rámce. S těmito mutacemi je proteinový produkt úplně jiný než u divokého typu . Zpravidla se při posunu čtecího rámce objevují předčasné stop kodony, které způsobují tvorbu zkrácených proteinů [36] . Protože tyto mutace významně narušují funkci proteinu, jsou zřídka fixovány selekcí : často nepřítomnost proteinu vede ke smrti organismu ještě před narozením [37] . Frameshift mutace jsou spojeny s nemocemi, jako je Tay-Sachsova nemoc [38] .
Přestože je naprostá většina mutací škodlivá nebo neutrální , některé se ukáží jako prospěšné [39] . Mohou poskytnout organismu lepší adaptaci než divoký typ na určité podmínky prostředí nebo mu umožnit rychlejší reprodukci než divoký typ. V tomto případě se mutace bude postupně šířit populací v průběhu neutrální selekce [40] . Viry , jejichž genomy jsou reprezentovány RNA, velmi rychle mutují [41] , což jim často prospívá, protože imunitní systém , který některé varianty virových antigenů efektivně rozpozná , je proti mírně změněným bezmocný [42] . Ve velkých populacích nepohlavně se rozmnožujících organismů, jako je E. coli , se může současně objevit několik prospěšných mutací. Tento jev se nazývá klonální interference a způsobuje konkurenci mezi mutacemi [43] .
Schopnost různých kodonů kódovat stejnou aminokyselinu se nazývá degenerace kódu. Poprvé byl genetický kód Nirenbergem a Bernfieldem nazván degenerovaný Navzdory degeneraci však v genetickém kódu neexistuje žádná nejednoznačnost. Například kodony GAA a GAG oba kódují glutamát , ale ani jeden nekóduje současně žádnou jinou aminokyselinu. Kodony odpovídající stejné aminokyselině se mohou lišit v jakékoli poloze, ale nejčastěji se první dvě polohy takových kodonů shodují a liší se pouze poslední. Díky tomu mutace, která ovlivňuje třetí pozici kodonu, s největší pravděpodobností neovlivní proteinový produkt [44] .
Tento rys lze vysvětlit nejednoznačnou hypotézou páru bází , kterou navrhl Francis Crick . Podle této hypotézy nemusí být třetí nukleotid v kodonu DNA plně komplementární k antikodonu tRNA, aby se kompenzoval nesoulad mezi počtem typů tRNA a počtem kodonů [45] [46] .
Kodony aminokyselin s podobnými fyzikálně-chemickými vlastnostmi jsou také často podobné, díky čemuž mutace nevedou k významnému narušení struktury proteinu. Kodony NUN (N je jakýkoli nukleotid) tedy obvykle kódují hydrofobní aminokyseliny. NCN kódují malé aminokyseliny se střední hydrofobností, zatímco NAN kódují středně velké hydrofilní aminokyseliny. Genetický kód je z hlediska hydrofobnosti uspořádán tak optimálně, že matematická analýza využívající singulární rozklad 12 proměnných (4 nukleotidy na 3 pozice) poskytuje významnou korelaci (0,95) pro predikci hydrofobnosti aminokyseliny podle jejího kodonu [47] . Osm aminokyselin není mutacemi na třetí pozici vůbec ovlivněno a mutace na druhé pozici zpravidla vedou k nahrazení aminokyselinou se zcela odlišnými fyzikálně-chemickými vlastnostmi. Největší vliv na proteinový produkt však mají mutace na prvních pozicích. Mutace, které vedou k nahrazení nabité aminokyseliny aminokyselinou s opačným nábojem, tedy mohou ovlivnit pouze první polohu a nikdy druhou. Taková změna náboje bude mít pravděpodobně silný vliv na strukturu proteinu [48] .
Níže uvedená tabulka ukazuje genetický kód společný většině pro- a eukaryot . Tabulka uvádí všech 64 kodonů a seznam odpovídajících aminokyselin. Pořadí bází je od 5' do 3' konce mRNA. Uvádí se třípísmenné a jednopísmenné označení aminokyselin.
nepolární | polární | základní | kyselina | (stop kodon) |
1. základna |
2. základna | 3. základna | |||||||
---|---|---|---|---|---|---|---|---|---|
U | C | A | G | ||||||
U | UUU | (Phe/F) Fenylalanin | UCU | (Ser/S) Serin | UAU | (Tyr/Y) Tyrosin | UGU | (Cys/C) Cystein | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | (Leu/L) Leucin | UCA | UAA | Stop ( okrová ) | UGA | Stop ( opál ) | A | ||
UUG | UCG | UAG | Stop ( jantarová ) | UGG | (Trp/W) Tryptofan | G | |||
C | CUU | CCU | (Pro/P) Prolin | CAU | (His/H) Histidin | CGU | (Arg/R) Arginin | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | (Gln/Q) Glutamin | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | (Ile/I) Isoleucin | ACU | (Thr/T) Threonin | AAU | (Asn/N) Asparagin | AGU | (Ser/S) Serin | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | (Lys/K) Lysin | AGA | (Arg/R) Arginin | A | |||
SRPEN [A] | (Met/M) Methionin | ACG | AAG | AGG | G | ||||
G | GUU | (Val/V) Valin | GCU | (Ala/A) Alanin | GAU | (Asp/D) Kyselina asparagová | GGU | (Gly/G) Glycin | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | (Glu/E) Kyselina glutamová | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
Ala /A | GCU, GCC, GCA, GCG | Leu/L | UUA, UUG, CUU, CUC, CUA, CUG |
---|---|---|---|
Arg /R | CGU, CGC, CGA, CGG, AGA, AGG | Lys/K | AAA, AAG |
Asn /N | AAU, AAC | Met/M | SRPEN |
Asp /D | GAU, GAC | Phe/F | UUU, UUC |
Cys /C | UGU, UGC | Podpěra | CCU, CCC, CCA, CCG |
Gln /Q | CAA, CAG | Ser /S | UCU, UCC, UCA, UCG, AGU, AGC |
Lepidlo | GAA, GAG | Thr /T | ACU, ACC, ACA, ACG |
Gly /G | GGU, GGC, GGA, GGG | Trp/W | UGG |
Jeho /H | CAU, CAC | Tyr /Y | UAU, UAC |
Ile/I | AUU, AUC, AUA | Val/V | GUU, GUC, GUU, GUG |
START | SRPEN | STOP | UAG, UGA, UAA |
V některých proteinech jsou nestandardní aminokyseliny kódovány stop kodony v závislosti na přítomnosti speciální signální sekvence v mRNA. Například stop kodon UGA může kódovat selenocystein , zatímco UAG může kódovat pyrrolysin . Selenocystein a pyrrolysin jsou považovány za 21. a 22. proteinogenní aminokyselinu. Na rozdíl od selenocysteinu má pyrrolysin svou vlastní aminoacyl-tRNA syntetázu [50] . Ačkoli je obvykle genetický kód používaný buňkami jednoho organismu fixní, archaean Acetohalobium arabaticum může přejít z 20-aminokyselinového kódu na 21-aminokyselinový kód (včetně pyrrolysinu) za různých růstových podmínek [51] .
Existence odchylek od standardního genetického kódu byla předpovězena již v 70. letech 20. století [52] . První odchylka byla popsána v roce 1979 v lidských mitochondriích [53] . Následně bylo popsáno několik dalších alternativních genetických kódů mírně odlišných od standardu, včetně alternativních mitochondriálních kódů [54] .
Například u bakterií rodu Mycoplasma stop kodon UGA kóduje tryptofan, zatímco u kvasinek z takzvaného „ kladu CTG “ (včetně patogenního druhu Candida albicans ) kodon CUG kóduje serin, a nikoli leucin, jako např. standardní genetický kód [55] [56] [57] . Protože viry používají stejný genetický kód jako jejich hostitelské buňky, odchylky od standardního genetického kódu mohou narušit replikaci viru [58] . Některé viry, například viry rodu Totivirus , však používají stejný alternativní genetický kód jako hostitelský organismus [59] .
U bakterií a archaea často působí GUG a UUG jako startovací kodony [60] . V lidském jaderném genomu existují také určité odchylky od standardního genetického kódu: například ve 4% mRNA enzymu malátdehydrogenázy jeden ze stop kodonů kóduje tryptofan nebo arginin [61] . Hodnota stop kodonu závisí na jeho prostředí [30] . Odchylky v genetickém kódu organismu lze detekovat nalezením velmi konzervativních genů v jeho genomu a porovnáním jejich kodonů s odpovídajícími aminokyselinami homologních proteinů blízce příbuzných organismů. Na tomto principu funguje program FACIL, který vypočítává frekvenci, s jakou každý kodon odpovídá konkrétní aminokyselině, a také určuje podporu stop kodonu a výsledek prezentuje ve formě loga (LOGO) [62] . Přes všechny tyto rozdíly jsou však genetické kódy používané všemi organismy v zásadě podobné [63] .
Níže uvedená tabulka uvádí aktuálně známé nestandardní genetické kódy [64] [65] . Existuje 23 nestandardních genetických kódů, přičemž nejběžnějším rozdílem od standardního genetického kódu je konverze stop kodonu UGA na sense kodon kódující tryptofan [66] .
Seznam nestandardních genetických kódůBiochemické vlastnosti aminokyselin | nepolární | polární | hlavní | kyselý | Ukončení: stop kodon |
Kód | Překladová tabulka |
kodon DNA | RNA kodon | Vysílejte s tímto kódem |
Standardní vysílání | Poznámky | ||
---|---|---|---|---|---|---|---|---|
standardní | jeden | Obsahuje překladovou tabulku 8 ( rostlinné chloroplasty ) | ||||||
Mitochondriální kód obratlovců | 2 | AGA | AGA | Ter (*) | Arg (R) | |||
AGG | AGG | Ter (*) | Arg (R) | |||||
ATA | AUA | Splněno (M) | Ile (já) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Mitochondriální genetický kód kvasinek | 3 | ATA | AUA | Splněno (M) | Ile (já) | |||
CTT | CUU | Thr (T) | leu (L) | |||||
CTC | CUC | Thr (T) | leu (L) | |||||
CTA | CUA | Thr (T) | leu (L) | |||||
CTG | CUG | Thr (T) | leu (L) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
CGA | CGA | nepřítomný | Arg (R) | |||||
CGC | CGC | nepřítomný | Arg (R) | |||||
Mitochondriální genetický kód slizniček, prvoků, cnidarians a genetický kód Mycoplasma a Spiroplasma | čtyři | TGA | UGA | TRP (W) | Ter (*) | Obsahuje překladovou tabulku 7 ( kinetoplast ) | ||
Mitochondriální kód bezobratlých | 5 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Ser (S) | Arg (R) | |||||
ATA | AUA | Splněno (M) | Ile (já) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetický kód nálevníků, Dasycladacea a Hexamita | 6 | TAA | UAA | Gln (Q) | Ter (*) | |||
ŠTÍTEK | UAG | Gln (Q) | Ter (*) | |||||
Mitochondriální genetický kód ostnokožců a plochých červů | 9 | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetický kód Euplotidae | deset | TGA | UGA | Cys (C) | Ter (*) | |||
Genetický kód bakterií, archeí a plastidů rostlin | jedenáct | Viz překladová tabulka 1 | ||||||
Alternativní genetický kód kvasinek | 12 | CTG | CUG | Ser (S) | leu (L) | |||
Mitochondriální genetický kód ascidiánů | 13 | AGA | AGA | Gly (G) | Arg (R) | |||
AGG | AGG | Gly (G) | Arg (R) | |||||
ATA | AUA | Splněno (M) | Ile (já) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Alternativní mitochondriální genetický kód pro ploché červy | čtrnáct | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
TAA | UAA | Tyr (Y) | Ter (*) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetický kód Blepharisma | patnáct | ŠTÍTEK | UAG | Gln (Q) | Ter (*) | |||
Mitochondriální genetický kód Chlorophycia | 16 | ŠTÍTEK | UAG | leu (L) | Ter (*) | |||
Mitochondriální genetický kód motolic | 21 | TGA | UGA | TRP (W) | Ter (*) | |||
ATA | AUA | Splněno (M) | Ile (já) | |||||
AGA | AGA | Ser (S) | Arg (R) | |||||
AGG | AGG | Ser (S) | Arg (R) | |||||
AAA | AAA | Asn (N) | Lys (K) | |||||
Mitochondriální genetický kód Scenedesmus obliquus | 22 | TCA | UCA | Ter (*) | Ser (S) | |||
ŠTÍTEK | UAG | leu (L) | Ter (*) | |||||
Mitochondriální genetický kód Thraustochytrium | 23 | TTA | UUA | Ter (*) | leu (L) | Podobně jako u překladové tabulky 11. | ||
Mitochondriální genetický kód křídelních žáber | 24 | AGA | AGA | Ser (S) | Arg (R) | |||
AGG | AGG | Lys (K) | Arg (R) | |||||
TGA | UGA | TRP (W) | Ter (*) | |||||
Genetický kód možných skupin SR1 a Gracilibacteria | 25 | TGA | UGA | Gly (G) | Ter (*) | |||
Genetický kód Pachysolen tannophilus | 26 | CTG | CUG | ala (A) | leu (L) | |||
Genetický kód Karyorelictea | 27 | TAA | UAA | Gln (Q) | Ter (*) | |||
ŠTÍTEK | UAG | Gln (Q) | Ter (*) | |||||
TGA | UGA | Ter (*) | nebo | TRP (W) | Ter (*) | |||
Genetický kód Condylostoma | 28 | TAA | UAA | Ter (*) | nebo | Gln (Q) | Ter (*) | |
ŠTÍTEK | UAG | Ter (*) | nebo | Gln (Q) | Ter (*) | |||
TGA | UGA | Ter (*) | nebo | TRP (W) | Ter (*) | |||
Genetický kód Mesodinium | 29 | TAA | UAA | Tyr (Y) | Ter (*) | |||
ŠTÍTEK | UAG | Tyr (Y) | Ter (*) | |||||
Genetický kód Peritrichia | třicet | TAA | UAA | Glu (E) | Ter (*) | |||
ŠTÍTEK | UAG | Glu (E) | Ter (*) | |||||
Genetický kód Blastocrithidia | 31 | TAA | UAA | Ter (*) | nebo | Gln (Q) | Ter (*) | |
ŠTÍTEK | UAG | Ter (*) | nebo | Gln (Q) | Ter (*) | |||
TGA | UGA | TRP (W) | Ter (*) |
V genomech mnoha organismů je pozorována tzv. kodonová preference, to znamená, že frekvence výskytu všech synonymních kodonů odpovídajících určité aminokyselině není stejná a u některých kodonů je vyšší než u jiných [67] [ 68] . Evoluční základ pro vznik kodonové preference je nejasný. Podle jedné hypotézy jsou ty kodony, které mutují nejčastěji, méně časté. Jiná hypotéza uvádí, že preference kodonů je regulována přirozeným výběrem ve prospěch těch, které poskytují největší účinnost a přesnost genové exprese [69] [70] . Preference kodonů je silně spojena s obsahem GC v genomu a v některých případech může obsah GC dokonce předpovídat frekvenci používání kodonů [71] . Z funkčního hlediska je kodonová preference spojena s účinností a přesností translace, a tedy s úrovní genové exprese [72] [73] .
V současnosti je nejpřijímanější hypotézou o původu života na Zemi hypotéza o světě RNA . Jakýkoli model vzniku genetického kódu využívá hypotézu přenosu základních funkcí z RNA enzymů ( ribozymů ) na proteinové enzymy. Jak naznačuje hypotéza světa RNA, tRNA se objevily před aminoacyl-tRNA syntetázami, takže tyto enzymy nemohly ovlivnit vlastnosti tRNA [74] .
Genetický kód posledního univerzálního společného předka (LUCA) byl s největší pravděpodobností založen spíše na DNA než na RNA [75] . Genetický kód se skládal ze tří nukleotidových kodonů a celkem bylo 64 různých kodonů. Protože ke stavbě proteinů bylo použito pouze 20 aminokyselin , některé aminokyseliny byly kódovány více kodony [76] [77] [78] [79] .
Pokud by korespondence mezi kodony a aminokyselinami byla náhodná, v přírodě by existovalo 1,5 × 1084 genetických kódů [80] . Toto číslo bylo získáno výpočtem počtu způsobů, kterými bylo možné 21 položek (20 kodonů aminokyselin a jeden stop kodon) roztřídit do 64 přihrádek tak, aby každá položka byla použita alespoň jednou [81] . Shody mezi kodony a aminokyselinami však nejsou náhodné [82] . Aminokyseliny, které sdílejí společnou biosyntetickou dráhu, mají tendenci sdílet polohu prvního kodonu. Tato skutečnost může být pozůstatkem dřívějšího, jednoduššího genetického kódu, který obsahoval méně aminokyselin než ten moderní a postupně zahrnoval všech 20 aminokyselin [83] . Kodony aminokyselin s podobnými fyzikálně-chemickými vlastnostmi mají také tendenci být podobné, což zmírňuje účinky bodových mutací a translačních poruch [84] [85] .
Protože genetický kód není náhodný, věrohodná hypotéza o jeho původu by měla vysvětlit takové vlastnosti standardního genetického kódu, jako je absence kodonů pro D -aminokyseliny, zahrnutí pouze 20 aminokyselin z možných 64, omezení synonymní substituce na třetí pozici kodonů, fungování kodonů jako stop kodony UAG, UGA a UAA [86] . Existují tři hlavní hypotézy původu genetického kódu. Každý z nich je zastoupen mnoha modely, mnoho modelů je hybridních [87] .
Slovníky a encyklopedie | |
---|---|
V bibliografických katalozích |
|