Promotor ( angl. promotor ) je nukleotidová sekvence DNA rozpoznávaná RNA polymerázou jako startovací rampa pro zahájení transkripce . Promotor hraje jednu z klíčových rolí v procesu iniciace transkripce [1] .
Obvykle se promotor nachází kolem počátečního bodu transkripce - prvního nukleotidu, ze kterého je transkript získán, který má souřadnici +1 (předchozí nukleotid je označen jako -1). Promotor obvykle obsahuje řadu motivů , které jsou důležité pro jeho rozpoznání RNA polymerázou. Konkrétně -10 a -35 prvků u bakterií , TATA-box u eukaryot [1] .
Promotor je asymetrický, umožňuje RNA polymeráze zahájit transkripci ve správném směru a ukazuje, který ze dvou řetězců DNA bude sloužit jako templát pro syntézu RNA . Řetězec templátu DNA se nazývá nekódující, zatímco druhý kódující řetězec odpovídá výsledné RNA v sekvenci (s výjimkou nahrazení thyminu uracilem ) [ 1] .
Rozhodující roli v intenzitě exprese tohoto genu v každém konkrétním buněčném typu hraje promotor, pod kterým se nachází kódující oblast RNA DNA. Podle aktivity se promotory dělí na konstitutivní (konstantní úroveň transkripce) a indukovatelné (transkripce závisí na podmínkách v buňce, např. přítomnost určitých látek nebo přítomnost tepelného šoku). Aktivace promotoru je určena přítomností souboru transkripčních faktorů [1] .
Bakteriální jádrová RNA polymeráza (skládající se z podjednotek α2ββ'ω) může iniciovat transkripci kdekoli v genomu. V buňce však k iniciaci dochází pouze v promotorových oblastech. Tuto specifičnost zajišťuje σ-podjednotka ( σ-faktor ), která v komplexu s jádrem enzymu tvoří holoenzym . Hlavním σ-faktorem buněk Escherichia coli je podjednotka σ 70 [1] .
Klasický (070 ) promotor sestává ze dvou konzervovaných sekvencí o délce 6 nukleotidů, umístěných proti směru transkripce od místa startu transkripce ve vzdálenosti 10 a 35 bp, oddělených 17 nukleotidy. Tyto sekvence se nazývají -10 a -35 prvků . Prvky nejsou identické ve všech promotorech, ale lze pro ně získat konsenzuální sekvence [1] .
Některé silné promotory mají také prvek UP upstream od prvku -35, který zvyšuje úroveň vazby RNA polymerázy. Některé promotory σ 70 nemají prvek -35, ale místo toho mají prvek -10 rozšířený o několik nukleotidů ( rozšířený -10 ). Toto je promotor galaktózového operonu E. coli . Někdy se pod -10-prvkem nachází další spojovací prvek - diskriminátor [1] .
Alternativní σ-podjednotky RNA polymerázy mění specificitu rozpoznávání promotoru. Například podjednotka σ 32 způsobuje rozpoznání promotorů genů reakce na teplotní šok, σ 54 je spojena s geny metabolismu dusíku [1] .
Eukaryotické buňky obsahují několik typů RNA polymeráz. Transkripci mRNA provádí RNA polymeráza II spolu se sadou proteinových transkripčních faktorů [1] .
Eukaryotický jádrový promotor je minimální soubor sekvenčních prvků potřebných pro vazbu RNA polymerázy II a transkripčních faktorů účastnících se zahájení transkripční iniciace. Typicky je jádrový promotor dlouhý 40-60 bp a může být umístěn buď nad nebo pod počátečním bodem transkripce. Kompletní sada elementů jádrového promotoru zahrnuje BRE element , TATA box , Inr (iniciátor) a/nebo downstream elementy (DPE, DCE a MTE). Obvykle promotor obsahuje kombinaci těchto prvků. Například DPE a TATA box se obvykle nevyskytují současně v jednom promotoru. Často se vyskytuje kombinace TATA box, DPE a Inr [1] .
promotorový prvek | Vazebný protein | Souřadnice | Konsensuální sekvence |
---|---|---|---|
prvek BRE | TFIIB | -37 -32 | [GC][GC][GA]CGCCC |
TATA box | TBP | -31 -26 | TATA[AT]A[AT] |
Inr | TFIID | -2 + 4 | [CT][CT]AN[TA][CT][CT] |
DCE I | TFIID | +6 +11 | CTTC |
DCE II | TFIID | +16 +21 | CTGT |
MTE | +21 +28 | ||
DPE | TFIID | +28 +32 | [AG]G[AT]CGTG |
DCE III | TFIID | +30 +34 | AGC |
Pro pokračování transkripce eukaryot je také nezbytná interakce s regulačními sekvencemi umístěnými od počátečního bodu transkripce – proximální sekvence, enhancery , tlumiče , izolátory, hraniční elementy [1] .
V eukaryotických buňkách jsou kromě RNA polymerázy II další dvě RNA polymerázy, které přepisují rRNA ( za to je zodpovědná RNA polymeráza I ) a nekódující RNA , jako je tRNA a 5sRNA (přepisují se RNA polymerázou III ) [1 ] .
RNA polymeráza I v eukaryotických buňkách přepisuje jediný rRNA prekurzorový gen , přítomný v mnoha kopiích v genomu. Promotor genu rRNA obsahuje základní elementy (koordináty kolem -45 +20) a UCE ( upstream kontrolní element , souřadnice kolem -150-100). Iniciace transkripce tohoto genu také vyžaduje několik transkripčních faktorů, TBP, SL1 (skládá se z proteinů TBP a tří TAF) a UBF. UBF váže element UCE, SF1 váže jádrový promotor. Vázaný UBF stimuluje vazbu polymerázy k oblasti jádrového promotoru [1] .
RNA polymeráza III přepisuje geny některých nekódujících RNA buňky ( tRNA , 5sRNA). Promotory RNA polymerázy III jsou velmi rozmanité a obvykle leží pod počátečním bodem transkripce. Zejména promotory tRNA genů obsahují A- a B-boxy, k iniciaci jsou nutné transkripční faktory TFIIIB a TFIIIC. Jiné promotory mohou obsahovat A- a C-boxy (například 5sRNA), pro iniciaci jsou nutné transkripční faktory TFIIIA, TFIIIB, TFIIIC. Skupina promotorů RNA polymerázy III obsahuje TATA boxy [1] .
K regulaci úrovně transkripce často dochází ve fázi iniciace, tedy od vazby RNA polymerázy na promotor před začátkem elongace [1] .
Oblast promotoru v operonu v bakteriích se může překrývat nebo se vůbec nepřekrývat s oblastí operátoru cistronu ( genu ) . U bakterií je vazba na promotor určena strukturní částí polymerázy, σ-podjednotkou. Na regulaci se často podílejí i regulační proteiny, které mohou proces urychlit a zvýšit jeho účinnost (aktivátory) nebo zpomalit (represory) [1] .
Transkripce eukaryot je regulována podobným způsobem jako u bakterií (díky odlišným regulačním proteinům), ale také se liší. Eukaryotické geny netvoří operony, každý gen má svůj promotor. Eukaryota mají chromatin složený z DNA a nukleozomů. Jak DNA, tak nukleozomy mohou projít chemickou modifikací, která ovlivňuje úroveň transkripce. Také další oblasti DNA, jako jsou enhancery, tlumiče, izolátory, hraniční elementy, se podílejí na regulaci promotorů u eukaryot [1] .
Sekvence a regulační rysy mnoha promotorů z různých živých organismů jsou nyní dobře známy. Tyto poznatky jsou široce využívány při tvorbě bioinženýrských genetických konstruktů ( plazmidy , vektory ). Pro expresi produktu v bakteriálních nebo eukaryotických buňkách lze použít jak promotor charakteristický pro tuto skupinu organismů nacházející se v genomu, tak promotor, například z virů, které tento organismus infikují [1] .
Klasické příklady bakteriálních operonů se známou regulací prokaryotických promotorů jsou: laktózový promotor , tryptofanový promotor , arabinózový promotor , GABA operon , galaktózový operon . Dobře prozkoumanými promotory eukaryotických buněk jsou kvasinkový promotor GAL1, indukovatelný TRE tetracyklinový promotor a indukovatelný edkysonový promotor. Ve virovém genomu, stejně jako v pro- a eukaryotických genomech, jsou promotory, např. T5 fágový promotor, T7 fágový promotor, konstitutivní promotory virů SV40 (polyomavirus), RSV, CMV (cytomegalovirus) [1] .
Promotorové predikční algoritmy často produkují velké množství falešně pozitivních výsledků (předpovídají promotorové sekvence, které nejsou promotory). Například v průměru různé algoritmy předpovídají jeden promotor na 1000 bp, zatímco lidský genom obsahuje přibližně jeden gen na 30 000–40 000 bp. [2] Tento výsledek je způsoben tím, že při předpovídání promotorů je třeba vzít v úvahu mnoho faktorů [2] :
Navzdory výše popsaným obtížím existuje mnoho algoritmů pro predikci promotorových oblastí v různých organismech. Níže uvedená tabulka ukazuje některé z nich.
Název algoritmu | Jak funguje algoritmus | Co algoritmus předpovídá |
---|---|---|
TSSW [3] | Algoritmus předpovídá potenciální místa začátku transkripce pomocí lineární diskriminační funkce, která kombinuje charakteristiky, které popisují funkční motivy a oligonukleotidové složení těchto míst. TSSW využívá databázi funkčních stránek TRANSFAC (jejíž autorem je E. Wingender [4] , odtud poslední písmeno v názvu metody TSSW). | PolII oblast lidského promotoru. |
TSSG [3] /Fprom [3] | Algoritmus TSSG funguje stejně jako TSSW, ale používá jinou databázi TFD [5] . Fprom je stejný TSSG trénovaný na jiné sadě promotorových sekvencí. | TSSG, oblast lidského promotoru PolII, Fprom, oblast lidského promotoru. |
TSSP [3] | Algoritmus funguje stejně jako TSSW s využitím databáze regulačních prvků rostlin RegSite [6] . Algoritmus byl zároveň trénován na sekvencích rostlinných promotorových oblastí. | oblast rostlinného promotoru. |
PEPPER [7] | Algoritmus předpovídá promotorovou oblast na základě kurátorské matice polohové váhy a skrytého Markovova modelu pro -35 a -10 konsenzuální sekvence, stejně jako různá vazebná místa Bacillus subtilis a Escherichia coli (bráno jako zástupci Gram -pozitivních a Gram- negativní bakterie). | Promotorová oblast prokaryot (vhodná hlavně pro bakteriální genomy). |
PromoterInspector [8] | Heuristický algoritmus je založen na genomovém prostředí promotorové oblasti vzorku savčích sekvencí. | Oblast promotoru PolII savců. |
BPROM [3] | Algoritmus funguje stejně jako TSSW s využitím databáze funkčních stránek DPInteract [9] . | a 70 oblast promotoru E. coli . |
NNPP 2.2 [10] | Program je neuronová síť se zpožděním, která se skládá ze dvou funkčních vrstev, jedné pro rozpoznávání TATA-boxu a druhé pro rozpoznávání Inr-prvků. | Promotorová oblast eukaryot a prokaryot. |
G4PromFinder [11] | Algoritmus identifikuje domnělé promotory založené na elementech bohatých na AT a motivech G-kvadruplex DNA v oblasti bohaté na GC. | Promotorová oblast bakterií. |
S nárůstem počtu predikovaných, experimentálně ukázaných promotorových oblastí různých organismů bylo nutné vytvořit databázi promotorových sekvencí. Největší databází eukaryotických promotorových sekvencí (hlavně obratlovců) je databáze eukaryotických promotorů [12] . Databáze je rozdělena na dvě části. První (EPD) je upravený soubor promotorových sekvencí získaných zpracováním experimentálních dat, druhý (EPDnew) je výsledkem sloučení informací o promotoru z databáze EPD s analýzou dat z vysoce výkonných sekvenačních metod. Pomocí vysoce výkonných metod získávání transkriptomů se podařilo získat sadu promotorů pro některé zástupce rostlin a hub: Arabidopsis thaliana (Tal's coli), Zea mays (kukuřice cukrová), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .
Slovníky a encyklopedie | |
---|---|
V bibliografických katalozích |
Přepis (biologie) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Regulace transkripce |
| ||||||||||||
Aktivace | |||||||||||||
Zahájení | Místo začátku přepisu | ||||||||||||
Prodloužení |
| ||||||||||||
Ukončení |