3' -Nepřeložená oblast (3'-UTR , anglicky 3'-untranslated region, 3'-UTR ) je nekódující oblast mRNA lokalizovaná na jejím 3'-konci za kódující oblastí . Oblast DNA odpovídající 3'-UTR transkriptu má stejný název [1] . 3′-UTR se může podílet na regulaci účinnosti translace a stability mRNA, může obsahovat polyadenylační signály [2] a vazebná místa pro mikroRNA a také vykonávat řadu dalších regulačních funkcí.
Délka 3'-UTR může být od 60 do 4000 nukleotidů . Průměrná délka 3'-UTR u lidí je asi 800 nukleotidů, zatímco průměrná délka 5'-UTR je 200 nukleotidů [3] . Je pozoruhodné, že celková délka 3′-UTR u lidí je více než dvojnásobná než u jiných savců , což ukazuje na větší počet regulačních prvků u lidí než u jiných savců [4] . Složení bází se také liší v 3'- a 5'-UTR. Obsah G + C je tedy vyšší v 5'-UTR než v 3'-UTR. Tento rozdíl je patrný zejména u mRNA teplokrevných obratlovců, u kterých je obsah G+C v 5'-UTR 60 % a v 3'-UTR 45 % [5] [6] .
Délka a sekundární struktura 3'-UTR jsou do značné míry určeny jeho účastí na interakcích mezi 5'-koncem transkriptu a 3'-koncem (viz níže) a často dlouhé 3'-UTR mají významnou vliv na genovou expresi . V roce 1996 se ukázalo, že zvýšení mRNA 3'-UTR z 19 na 156 nukleotidů snížilo expresi faktorem 45, bez ohledu na orientaci, gen nebo sekvenci vložených nukleotidů. To ukazuje, že délka 3'-UTR je důležitá pro expresi mRNA. Dalším faktorem určujícím důležitost délky 3'-UTR, kromě interakce 3'- a 5'-UTR, je schopnost 3'-UTR interagovat s miRNA , speciálními regulačními molekulami RNA , které potlačují translaci ( další podrobnosti viz níže). Tyto interakce probíhají na speciálních místech, která jsou hojnější v dlouhých 3′-UTR, takže dlouhé 3′-UTR může mít silnější inhibiční účinek na translaci. Bylo tedy provedeno srovnání délky 3′-UTR a počtu vazebných míst pro mikroRNA na něm v genech ribozomálních proteinů a genech zapojených do neurogeneze . Ukázalo se, že ribozomální 3′-UTR geny jsou kratší a mají méně specifických vazebných míst pro mikroRNA, zatímco u genů zapojených do neurogeneze je naopak 3′-UTR delší a obsahuje mnoho specifických vazebných míst pro mikroRNA. Podívejme se na další příklad. Gen Hip2 používá alternativní 3′-UTR pro flexibilní kontrolu exprese (více o tomto jevu viz níže). Delší možná 3′-UTR tohoto genu obsahuje konzervovaná vazebná místa pro dvě miRNA exprimované v aktivovaných T buňkách . Po aktivaci se snížila relativní exprese transkriptu s delším 3'-UTR a zvýšila se celková exprese proteinu, protože byly exprimovány mRNA s kratšími 3'-UTR, které neobsahovaly vazebná místa pro inhibiční miRNA. Také se ukázalo, že délka 3′-UTR závisí na přítomnosti takových regulačních prvků, jako jsou prvky bohaté na AU ( ARE ) v něm (podrobněji viz níže) [4] .
Obecně platí, že dlouhé 3′-UTR jsou spojeny s relativně nízkou úrovní exprese, jak ukazují experimenty, které porovnávaly expresi izoforem jednoho proteinu, jehož mRNA se lišily pouze délkou 3′-UTR. Gen SLC7A1 je exprimován ve dvou mRNA s různými 3'-UTR, přičemž delší z nich obsahuje další vazebné místo pro mikroRNA. Funkční polymorfismus v tomto genu je spojen s výskytem endoteliální dysfunkce a dědičné predispozice k hypertenzi . Je zajímavé, že alela odpovědná za manifestaci těchto poruch má obvykle delší 3'-UTR, a proto je její hladina exprese nižší než u alely divokého typu , která má 3'-UTR kratší [4] .
Na rozdíl od 5'-UTR obsahují 3'-UTR relativně málo intronů (asi 5 %). Některé savčí geny vyplývající z reverzní transkripce ze sestřihnutého transkriptu mají introny v 3'-UTR, které snižují expresi těchto genů a směřují jejich transkripty do dráhy NMD (tj. přerušení). Tento negativní vliv intronů v 3′-UTR na genovou expresi může vysvětlit jejich nízkou distribuci v této oblasti. Navíc bylo zjištěno, že některé transkripty jsou schopny vázat se na miRNA pouze v přítomnosti intronu v 3'-UTR, který také potlačuje genovou expresi. To ukazuje, že odlišná excize intronů v 3′-UTR umožňuje izoformně specifickou regulaci zprostředkovanou mikroRNA, která může být provedena tkáňově specifickým způsobem [7] .
Zdá se, že sekundární struktura 3'-UTR má mnohem větší význam, než se dříve myslelo. Důležitá je nejen délka 3'-UTR, ale také jeho sekundární struktura a mutace , které jej mění, mohou narušit genovou expresi. V roce 2006 byla provedena studie na 83 3′-UTR variantách spojených s různými onemocněními a byl stanoven vztah mezi funkčností těchto variant a změnami v predikované sekundární struktuře [8] .
Sekundární strukturu 3′-UTR je obtížné předpovědět, protože mnoho proteinových faktorů, které se na ni vážou, může významně ovlivnit její prostorovou strukturu. Tyto faktory ji mohou změnit v důsledku destrukce záhybu mRNA nebo mohou interagovat s jinými faktory, díky nimž se mRNA může uzavřít do smyčky. Nejběžnějším příkladem sekundárních strukturních prvků, které mohou ovlivnit expresi, je vlásenka a proteiny vázající RNA se vážou na vlásenky v 3'-UTR. Transkript neurotrofického faktoru odvozeného z mozku (BDNF ) obsahuje dlouhou vlásenku odpovědnou za stabilitu mRNA v neuronech v reakci na signály vápníku . Předpokládá se, že vlásenka je vhodnou platformou pro interakci řady RNA-vazebných proteinů, nekódujících RNA a polyadenylačních signálů v reakci na Ca2 + . 3′-UTR transkriptu TNFα obsahuje prvek ARE , který tvoří vlásenku, která může modulovat afinitu této oblasti k různým proteinům (více podrobností viz níže). Tyto příklady ukazují, že modulace sekundární struktury 3'-UTR proteiny nebo jinými prostředky může změnit jeho vazebnou specificitu k různým trans '' faktorům, a tím regulovat genovou expresi na post- transkripční úrovni [9] .
Alternativní polyadenylace ( APA ) a alternativní sestřih jsou dva mechanismy vedoucí ke vzniku různých izoforem mRNA, které se liší svými 3′-UTR . APA se může vyskytovat v důsledku přítomnosti různých polyadenylačních míst a různých terminálních exonů ; Odhaduje se, že APA využívají ~ 50 % lidských genů. Tento mechanismus je velmi vhodný pro složité organismy, protože umožňuje transkriptům exprimovat stejný protein, ale na různých úrovních a v různých prostorových umístěních kvůli rozdílům v regulaci zprostředkované 3′-UTR. Alternativní 3'-UTR jsou extrémně důležité pro tkáňově specifickou genovou expresi, stejně jako pro variabilní expresi v různých vývojových stádiích . Významné změny v produktech ARA jsou charakteristické pro řadu typů rakoviny . ARA také hraje důležitou roli v lokalizaci proteinových izoforem. Proteinový produkt genu HuR je protein vázající ARE, který se podílí na stabilizaci mnoha mRNA obsahujících ARE. Vlivem ARA vzniká řada variant proteinu HuR, které se liší úrovní exprese, a přestože naprostá většina transkriptů tohoto proteinu postrádá ARE, některé mají stále funkční ARE v 3′-UTR. Tyto ARE jsou schopny vázat HuR, čímž poskytují regulaci pozitivní zpětnou vazbou. Použití alternativních 3'-UTR tedy umožňuje ještě větší rozmanitost proteinových produktů jednoho genu [10] .
MikroRNA jsou krátké jednovláknové nekódující molekuly RNA endogenního původu, dlouhé asi 20 nukleotidů. Interagují s cílovými mRNA podle principu komplementarity a obvykle blokují translaci cíle nebo způsobují jeho destrukci. Vazebná místa pro mikroRNA-mRNA se zpravidla nacházejí v 3'-UTR posledně jmenovaných, i když některá z nich se nacházejí v 5'-UTR a dokonce i v kódující oblasti. MikroRNA se často exprimují odlišně v závislosti na typu tkáně a vývojovém stádiu a geny zapojené do procesů společných všem genům se musí selektivně vyhýbat sekvencím v transkriptech, které jsou částečně komplementární k mikroRNA, to znamená, aby se vyhnuly přítomnosti vazebných míst pro mikroRNA. Tento proces selektivního vyhýbání se má obrovský dopad na vývoj 3′-UTR [11] .
Změna stability transkriptu umožňuje rychlou kontrolu exprese bez změny rychlosti translace. Takový mechanismus je důležitý v tak životně důležitých procesech, jako je buněčný růst a diferenciace , stejně jako adaptace na podmínky prostředí. Nejlépe prozkoumanými regulačními prvky, které regulují stabilitu mRNA, jsou prvky bohaté na AU ( ARE ) umístěné v 3'-UTR mRNA některých genů . Tyto elementy se pohybují ve velikosti od 50 do 150 nukleotidů a obvykle obsahují více kopií AUUUA pentanukleotidu [12] .
Bylo zjištěno, že sekvence ARE se liší a podle počtu a uspořádání motivů AUUUA se rozlišují 3 třídy ARE:
ARE se vážou na proteiny ( ARE -binding proteins, ARE-BP ), které zpravidla přispívají k destrukci mRNA v reakci na různé intra- a extracelulární signály, i když některé z nich regulují translaci . ARE regulují expresi genů kódujících cytokiny , růstové faktory , tumor supresorové geny , protoonkogeny a geny, jejichž proteinové produkty se podílejí na regulaci buněčného cyklu , jako jsou geny pro cykliny , enzymy , transkripční faktory , receptory a membránové proteiny . Tato rozmanitost genů, jejichž transkripty obsahují ARE, ukazuje na důležitost stability transkriptu v genové regulaci [12] . Kromě změny stability mRNA mohou ARE také aktivovat translaci, i když tento mechanismus je méně běžný a méně dobře pochopen [13] .
Dalším prvkem, který reguluje stabilitu transkriptu, je nedávno objevený prvek bohatý na GU (GRE) . Interaguje s CUGBP1 , proteinem vázajícím RNA, který podporuje rozklad související mRNA [13] .
Polyadenylace je proces přidání řady adenosinů (tj. poly(A) ocasu) na 3' konec nezralého RNA transkriptu [13] . Bylo zjištěno, že 3′-UTR obsahuje prvky, které tento proces regulují. Bylo tedy prokázáno, že všechny polyadenylační mRNA ve vzdálenosti 20–30 nukleotidů od 3'-konce transkriptu, ke kterému je připojen poly(A) ocas, obsahují sekvenci AAUAAA, polyadenylační signál (polyadenylační signály mohou být také blízké sekvence, jako je AU/GUAAAA nebo UAUAAA). Následně se ukázalo, že ačkoliv je sekvence AAUAAA pro polyadenylaci absolutně nezbytná, existují další prvky, bez kterých je normální připojení poly(A) ocasu nemožné. Konkrétně byla identifikována sekvence bohatá na GU bezprostředně za AAUAAA směrem ke 3' konci (nazývaná také anglický downstream sekvenční element, DSE ), stejně jako speciální sekvence umístěná bezprostředně před AAUAAA ( anglicky upstream sekvenční element, USE ) . . Tyto prvky jsou z velké části zachovány nejen pro savce , ale pro všechna eukaryota . Pro polyadenylaci jsou důležité i nukleotidy umístěné v místě řezu na 3′ konci transkriptu (po zlomu se k tomuto místu připojí poly(A) ocas). 3′-UTR tedy hraje zásadní roli v procesu polyadenylace [14] .
3′-UTR hraje zásadní roli v procesu maskování mRNA . K maskování mRNA dochází např. při oogenezi a spermatogenezi , kdy mRNA syntetizovaná při těchto procesech není překládána na protein, ale je uložena v neaktivním stavu, někdy i poměrně dlouhou dobu. Během oplodnění a během rané embryogeneze jsou mateřské mRNA demaskovány a jsou z nich syntetizovány potřebné proteiny. K maskování a ukládání mRNA dochází také v diferencujících somatických buňkách dospělého organismu po dlouhou dobu [15] .
Fenomén maskování mRNA byl poprvé studován u mlže Spisula solidissima v roce 1990. Ukázalo se, že v jeho oocytech je uloženo velké množství maskované mRNA kódující malou podjednotku ribonukleotidreduktázy a cyklinu A . Ukázalo se, že když je mRNA v maskovaném stavu, je s místem v jeho 3'-UTR asociován komplex maskovacích proteinů. Také se ukázalo, že maskované mRNA mají silně zkrácený poly(A) konec, z 200–250 adenylových zbytků na 20–40. Když je mRNA odmaskována, maskovací proteiny jsou fosforylovány , v důsledku čehož se čepička uvolní z blokujícího proteinu a je stimulována polyadenylace mRNA cytoplazmatickou poly(A) polymerázou , čímž se obnoví dlouhý poly(A) ocas nezbytný pro efektivní překlad [16] .
3′-UTR se někdy účastní procesu začlenění vzácné, ale funkčně důležité aminokyseliny , selenocysteinu , do polypeptidového řetězce . Pro selenocystein neexistuje žádný speciální kodon a Sec tRNA je připojena k terminačnímu kodonu UGA, ale pouze tehdy, když je následována speciální inzerční sekvencí selenocysteinu - SECIS , která tvoří charakteristický prvek sekundární struktury. SECIS může být umístěn ve značné vzdálenosti (až 200 nukleotidů) od UGA a u archaea a eukaryot je lokalizován v 3′-UTR mRNA [17] [18] .
NMD ( nonsens-mediated decay ) je účinný mechanismus pro destrukci nefunkčních mutantních transkriptů . Obvykle je účinnost v tomto mechanismu určena umístěním mutace vzhledem k exonovému spojení, nicméně určitou roli může hrát i 3'-UTR. Mechanismus ukončení translace u předčasných stop kodonů závisí na vzdálenosti mezi terminátorovým kodonem a poly(A)-vazebným proteinem PABPC1 . Bylo ukázáno, že zvětšení vzdálenosti mezi stop kodonem a poly(A) ocasem spouští NMD a změny v prostorové struktuře 3'UTR mohou modulovat NMD [8] .
Je známo, že mRNA je schopna se uzavřít do kruhu (cirkularizace) díky interakci speciálních proteinů, které se vážou na poly(A) ocas , což usnadňuje vazbu faktoru eIF4F na čepičku . Výsledkem je, že mRNA získává uzavřenou formu, stimuluje se iniciace translace a zvyšuje se účinnost translace. V některých případech se však 5'-UTR a 3'-UTR stejné mRNA mohou vzájemně vázat. Například mRNA lidského genu p53 má oblasti v 5'-UTR a 3'-UTR, které jsou vzájemně komplementární. Vazbou na sebe a na translační faktor RPL26 tím zvyšují účinnost translace proteinu p53 v reakci na poškození DNA [8] .
Analýza mRNA různých lidských genů ukázala, že 5′-UTR obsahuje motiv , který specificky interaguje s 3′-konci mikroRNA, zatímco mnoho z těchto mRNA má místo komplementární k 3′-UTR na 5′-konci. . Další studie ukázaly, že vazba 5'-UTR na miRNA usnadňuje vazbu 5' konce mRNA na 3' konec a mRNA, jejichž aktivita je silně určována miRNA, mají předvídatelná vazebná místa na obou UTR. Takové mRNA se nazývají miBridge. Dále bylo zjištěno, že ztráta těchto vazebných míst snížila represi translace transkriptu řízenou miRNA. Bylo tedy zjištěno, že k potlačení translace mRNA jsou nezbytná vzájemná vazebná místa UTR. To ukazuje, že pro přesnou regulaci genové exprese je nezbytná komplementární interakce 5′-UTR a 3′-UTR [9] .
Bakteriální mRNA také obsahuje 5'- a 3'-nepřekládané oblasti [19] [20] .
Na rozdíl od eukaryot jsou dlouhé 3′-UTR u bakterií vzácné a špatně pochopené. Je však známo, že některé bakterie, zejména Salmonella enterica , mají mRNA s eukaryotickými dlouhými 3'-UTR (u S. enterica je to hilD mRNA ). Předpokládá se, že hilD 3′-UTR plní různé funkce, zejména ovlivňují obrat svých mRNA, protože delece těchto oblastí způsobila zvýšení množství odpovídajících mRNA [21] .
Netranslatované oblasti také existují v mRNA mnoha archaea . Zejména v 5'- a 3'-UTR mRNA metanogenního archaea Methanococcus jannaschii (stejně jako u jiných zástupců řádů Methanopyrales a Methanococcales ) je lokalizován prvek SECIS , který je zodpovědný za vložení aminokyselina selenocystein do polypeptidového řetězce [22] .
Bylo zjištěno, že mRNA většiny haloarchaea , stejně jako mRNA Pyrobaculum a Sulfolobus , postrádá výrazné 5'-UTR, ale mRNA archaických methanogenů má dlouhé 5'-UTR. V tomto ohledu se předpokládá, že mechanismus iniciace translace u metanogenních archaea může být odlišný od mechanismu jiných zástupců této domény [23] . Haloarcheální mRNA však obsahuje 3'-UTR a jejich 3'-konce nepodléhají post-transkripční modifikaci. Těm haloarcheálním transkriptům, které mají 5'-UTR, překvapivě chybí Shine-Dalgarnova sekvence. Délka 3'-UTR haloarchaea se pohybovala od 20 do 80 nukleotidů; nebyly identifikovány žádné konzervované strukturní motivy a sekvence, kromě penta-U-nukleotidu v oblasti terminace translace [24] .
U mnoha virů k iniciaci translace dochází mechanismem nezávislým na čepičce a dochází k ní prostřednictvím prvků IRES umístěných v 5′-UTR [25] . U virů však byl nalezen další mechanismus iniciace translace nezávislý na čepičce , který není spojen s IRES. Tento mechanismus je přítomen v mnoha rostlinných virech . V tomto případě je v 3′-UTR umístěn speciální prvek překladu nezávislý na cap (CITE) . CITE často váže translační faktory, například komplex eIF4F, a poté komplementárně interaguje s 5'-koncem, čímž dodává faktory iniciace translace do místa svého začátku [26] .
U virů, jejichž genom je reprezentován jednořetězcovou molekulou RNA s kladnou polaritou , ovlivňuje 3′-UTR nejen translaci, ale účastní se také replikace : od ní začíná replikace virového genomu [27 ] .
Virus spalniček (rod Morbillivirus z čeledi Paramyxoviridae ) má genom reprezentovaný jednovláknovou molekulou RNA negativní polarity. Pro jeho geny M a F byl stanoven zajímavý mechanismus. mRNA těchto genů mají dlouhé UTR; tvoří ~ 6,4 % celkové mRNA. Ačkoli tyto geny nejsou přímo zapojeny do replikace , 3'-UTR mRNA genu M zvyšuje expresi proteinu M a tím spouští replikaci genomu. 5′-UTR mRNA genu F zároveň snižuje tvorbu proteinu F a tím potlačuje replikaci [28] .
Při studiu struktury a funkce 3′-UTR vědci používají několik různých metod. I když se ukáže, že daný 3′-UTR je přítomen v určité tkáni, pro získání úplného obrazu o jeho funkcích je nutné analyzovat účinky jeho odlišné lokalizace, určit dobu fungování, popsat interakce s trans- regulační proteiny a vliv na účinnost translace [29] . Pomocí bioinformatických metod, založených na analýze primární struktury (tj. nukleotidové sekvence), lze hledat ARE elementy a vazebná místa pro mikroRNA v daném 3'-UTR. Experimentální metody stanovují sekvence, které interagují s určitými trans-regulačními proteiny, a v současné době je možné na základě sekvenačních dat a experimentálních dat nalézt interakční místa s určitými proteiny v daném transkriptu [30] . Umělým vyvoláním mutací v 3′-UTR, jako jsou ty, které ovlivňují terminátorový kodon, polyadenylační signál nebo sekundární strukturu 3′-UTR, je možné zjistit, jak mohou mutace v těchto oblastech vést k poruchám translace a výskyt onemocnění (více o onemocněních spojených s 3′ -UTR, viz níže) [31] . Takže s pomocí všech těchto metod můžeme rozvíjet naše chápání struktury a funkcí cis-regulačních elementů v 3′-UTR, stejně jako proteinů interagujících s 3′-UTR.
Mutace ovlivňující 3′-UTR jsou důležité, protože jedna taková mutace může ovlivnit expresi mnoha genů. Ačkoli na transkripční úrovni mutace ovlivňují specifickou alelu a fyzikálně vázané geny, protože 3'-UTR vazebné proteiny se také účastní zpracování a exportu mRNA z jádra. Mutace tedy může ovlivnit nepříbuzné geny [32] . Například mutace v ARE vedou k nesprávné funkci ARE-vazebných proteinů, což vede k rozvoji onemocnění, jako je maligní degenerace krvetvorných orgánů a leukémie [33] [34] . Zvýšený obsah CTG trinukleotidu v 3′-UTR genu myotonin proteinkinázy způsobuje myotonickou dystrofii . Inzerce 3 kb retrotranspozonu sestávajícího z tandemových repetic do 3′-UTR genu pro fukutinový protein je spojována s vrozenou svalovou dystrofií Fukuyamova typu [29] . Změny v elementech lokalizovaných v 3′-UTR jsou spojeny s rozvojem takových lidských onemocnění, jako je akutní myeloidní leukémie , alfa talasémie , neuroblastom , keratinopatie, aniridie , syndrom IPEX , vrozené srdeční vady [31] . Asociace některých z těchto onemocnění se specifickými 3′-UTR elementy je znázorněna na obrázku níže.