Promotér

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 14. dubna 2022; ověření vyžaduje 1 úpravu .

Promotor ( angl.  promotor ) je nukleotidová sekvence DNA rozpoznávaná RNA polymerázou jako startovací rampa pro zahájení transkripce . Promotor hraje jednu z klíčových rolí v procesu iniciace transkripce [1] .

Obecné informace

Obvykle se promotor nachází kolem počátečního bodu transkripce - prvního nukleotidu, ze kterého je transkript získán, který má souřadnici +1 (předchozí nukleotid je označen jako -1). Promotor obvykle obsahuje řadu motivů , které jsou důležité pro jeho rozpoznání RNA polymerázou. Konkrétně -10 a -35 prvků u bakterií , TATA-box u eukaryot [1] .

Promotor je asymetrický, umožňuje RNA polymeráze zahájit transkripci ve správném směru a ukazuje, který ze dvou řetězců DNA bude sloužit jako templát pro syntézu RNA . Řetězec templátu DNA se nazývá nekódující, zatímco druhý kódující řetězec odpovídá výsledné RNA v sekvenci (s výjimkou nahrazení thyminu uracilem ) [ 1] .

Rozhodující roli v intenzitě exprese tohoto genu v každém konkrétním buněčném typu hraje promotor, pod kterým se nachází kódující oblast RNA DNA. Podle aktivity se promotory dělí na konstitutivní (konstantní úroveň transkripce) a indukovatelné (transkripce závisí na podmínkách v buňce, např. přítomnost určitých látek nebo přítomnost tepelného šoku). Aktivace promotoru je určena přítomností souboru transkripčních faktorů [1] .

Struktura promotérů

U bakterií

Bakteriální jádrová RNA polymeráza (skládající se z podjednotek α2ββ'ω) může iniciovat transkripci kdekoli v genomu. V buňce však k iniciaci dochází pouze v promotorových oblastech. Tuto specifičnost zajišťuje σ-podjednotka ( σ-faktor ), která v komplexu s jádrem enzymu tvoří holoenzym . Hlavním σ-faktorem buněk Escherichia coli je podjednotka σ 70 [1] .

Klasický (070 ) promotor sestává ze dvou konzervovaných sekvencí o délce 6 nukleotidů, umístěných proti směru transkripce od místa startu transkripce ve vzdálenosti 10 a 35 bp, oddělených 17 nukleotidy. Tyto sekvence se nazývají -10 a -35 prvků . Prvky nejsou identické ve všech promotorech, ale lze pro ně získat konsenzuální sekvence [1] .

Některé silné promotory mají také prvek UP upstream od prvku -35, který zvyšuje úroveň vazby RNA polymerázy. Některé promotory σ 70 nemají prvek -35, ale místo toho mají prvek -10 rozšířený o několik nukleotidů ( rozšířený -10 ). Toto je promotor galaktózového operonu E. coli . Někdy se pod -10-prvkem nachází další spojovací prvek - diskriminátor [1] .

Alternativní σ-podjednotky RNA polymerázy mění specificitu rozpoznávání promotoru. Například podjednotka σ 32 způsobuje rozpoznání promotorů genů reakce na teplotní šok, σ 54 je spojena s geny metabolismu dusíku [1] .

U eukaryot

Eukaryotické buňky obsahují několik typů RNA polymeráz. Transkripci mRNA provádí RNA polymeráza II spolu se sadou proteinových transkripčních faktorů [1] .

Eukaryotický jádrový promotor je minimální soubor sekvenčních prvků potřebných pro vazbu RNA polymerázy II a transkripčních faktorů účastnících se zahájení transkripční iniciace. Typicky je jádrový promotor dlouhý 40-60 bp a může být umístěn buď nad nebo pod počátečním bodem transkripce. Kompletní sada elementů jádrového promotoru zahrnuje BRE element , TATA box , Inr (iniciátor) a/nebo downstream elementy (DPE, DCE a MTE). Obvykle promotor obsahuje kombinaci těchto prvků. Například DPE a TATA box se obvykle nevyskytují současně v jednom promotoru. Často se vyskytuje kombinace TATA box, DPE a Inr [1] .

promotorový prvek Vazebný protein Souřadnice Konsensuální sekvence
prvek BRE TFIIB -37 -32 [GC][GC][GA]CGCCC
TATA box TBP -31 -26 TATA[AT]A[AT]
Inr TFIID -2 + 4 [CT][CT]AN[TA][CT][CT]
DCE I TFIID +6 +11 CTTC
DCE II TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCE III TFIID +30 +34 AGC

Pro pokračování transkripce eukaryot je také nezbytná interakce s regulačními sekvencemi umístěnými od počátečního bodu transkripce – proximální sekvence, enhancery , tlumiče , izolátory, hraniční elementy [1] .

V eukaryotických buňkách jsou kromě RNA polymerázy II další dvě RNA polymerázy, které přepisují rRNA ( za to je zodpovědná RNA polymeráza I ) a nekódující RNA , jako je tRNA a 5sRNA (přepisují se RNA polymerázou III ) [1 ] .

RNA polymeráza I v eukaryotických buňkách přepisuje jediný rRNA prekurzorový gen , přítomný v mnoha kopiích v genomu. Promotor genu rRNA obsahuje základní elementy (koordináty kolem -45 +20) a UCE ( upstream kontrolní element , souřadnice kolem -150-100). Iniciace transkripce tohoto genu také vyžaduje několik transkripčních faktorů, TBP, SL1 (skládá se z proteinů TBP a tří TAF) a UBF. UBF váže element UCE, SF1 váže jádrový promotor. Vázaný UBF stimuluje vazbu polymerázy k oblasti jádrového promotoru [1] .

RNA polymeráza III přepisuje geny některých nekódujících RNA buňky ( tRNA , 5sRNA). Promotory RNA polymerázy III jsou velmi rozmanité a obvykle leží pod počátečním bodem transkripce. Zejména promotory tRNA genů obsahují A- a B-boxy, k iniciaci jsou nutné transkripční faktory TFIIIB a TFIIIC. Jiné promotory mohou obsahovat A- a C-boxy (například 5sRNA), pro iniciaci jsou nutné transkripční faktory TFIIIA, TFIIIB, TFIIIC. Skupina promotorů RNA polymerázy III obsahuje TATA boxy [1] .

Regulace promotérů

K regulaci úrovně transkripce často dochází ve fázi iniciace, tedy od vazby RNA polymerázy na promotor před začátkem elongace [1] .

Oblast promotoru v operonu v bakteriích se může překrývat nebo se vůbec nepřekrývat s oblastí operátoru cistronu ( genu ) . U bakterií je vazba na promotor určena strukturní částí polymerázy, σ-podjednotkou. Na regulaci se často podílejí i regulační proteiny, které mohou proces urychlit a zvýšit jeho účinnost (aktivátory) nebo zpomalit (represory) [1] .

Transkripce eukaryot je regulována podobným způsobem jako u bakterií (díky odlišným regulačním proteinům), ale také se liší. Eukaryotické geny netvoří operony, každý gen má svůj promotor. Eukaryota mají chromatin složený z DNA a nukleozomů. Jak DNA, tak nukleozomy mohou projít chemickou modifikací, která ovlivňuje úroveň transkripce. Také další oblasti DNA, jako jsou enhancery, tlumiče, izolátory, hraniční elementy, se podílejí na regulaci promotorů u eukaryot [1] .

Příklady promotérů

Sekvence a regulační rysy mnoha promotorů z různých živých organismů jsou nyní dobře známy. Tyto poznatky jsou široce využívány při tvorbě bioinženýrských genetických konstruktů ( plazmidy , vektory ). Pro expresi produktu v bakteriálních nebo eukaryotických buňkách lze použít jak promotor charakteristický pro tuto skupinu organismů nacházející se v genomu, tak promotor, například z virů, které tento organismus infikují [1] .

Klasické příklady bakteriálních operonů se známou regulací prokaryotických promotorů jsou: laktózový promotor , tryptofanový promotor , arabinózový promotor , GABA operon , galaktózový operon . Dobře prozkoumanými promotory eukaryotických buněk jsou kvasinkový promotor GAL1, indukovatelný TRE tetracyklinový promotor a indukovatelný edkysonový promotor. Ve virovém genomu, stejně jako v pro- a eukaryotických genomech, jsou promotory, např. T5 fágový promotor, T7 fágový promotor, konstitutivní promotory virů SV40 (polyomavirus), RSV, CMV (cytomegalovirus) [1] .

Predikce regionu propagátora

Promotorové predikční algoritmy často produkují velké množství falešně pozitivních výsledků (předpovídají promotorové sekvence, které nejsou promotory). Například v průměru různé algoritmy předpovídají jeden promotor na 1000 bp, zatímco lidský genom obsahuje přibližně jeden gen na 30 000–40 000 bp. [2] Tento výsledek je způsoben tím, že při předpovídání promotorů je třeba vzít v úvahu mnoho faktorů [2] :

Navzdory výše popsaným obtížím existuje mnoho algoritmů pro predikci promotorových oblastí v různých organismech. Níže uvedená tabulka ukazuje některé z nich.

Název algoritmu Jak funguje algoritmus Co algoritmus předpovídá
TSSW [3] Algoritmus předpovídá potenciální místa začátku transkripce pomocí lineární diskriminační funkce, která kombinuje charakteristiky, které popisují funkční motivy a oligonukleotidové složení těchto míst. TSSW využívá databázi funkčních stránek TRANSFAC (jejíž autorem je E. Wingender [4] , odtud poslední písmeno v názvu metody TSSW). PolII oblast lidského promotoru.
TSSG [3] /Fprom [3] Algoritmus TSSG funguje stejně jako TSSW, ale používá jinou databázi TFD [5] . Fprom je stejný TSSG trénovaný na jiné sadě promotorových sekvencí. TSSG, oblast lidského promotoru PolII, Fprom, oblast lidského promotoru.
TSSP [3] Algoritmus funguje stejně jako TSSW s využitím databáze regulačních prvků rostlin RegSite [6] . Algoritmus byl zároveň trénován na sekvencích rostlinných promotorových oblastí. oblast rostlinného promotoru.
PEPPER [7] Algoritmus předpovídá promotorovou oblast na základě kurátorské matice polohové váhy a skrytého Markovova modelu pro -35 a -10 konsenzuální sekvence, stejně jako různá vazebná místa Bacillus subtilis a Escherichia coli (bráno jako zástupci Gram -pozitivních a Gram- negativní bakterie). Promotorová oblast prokaryot (vhodná hlavně pro bakteriální genomy).
PromoterInspector [8] Heuristický algoritmus je založen na genomovém prostředí promotorové oblasti vzorku savčích sekvencí. Oblast promotoru PolII savců.
BPROM [3] Algoritmus funguje stejně jako TSSW s využitím databáze funkčních stránek DPInteract [9] . a 70 oblast promotoru E. coli .
NNPP 2.2 [10] Program je neuronová síť se zpožděním, která se skládá ze dvou funkčních vrstev, jedné pro rozpoznávání TATA-boxu a druhé pro rozpoznávání Inr-prvků. Promotorová oblast eukaryot a prokaryot.
G4PromFinder [11] Algoritmus identifikuje domnělé promotory založené na elementech bohatých na AT a motivech G-kvadruplex DNA v oblasti bohaté na GC. Promotorová oblast bakterií.

S nárůstem počtu predikovaných, experimentálně ukázaných promotorových oblastí různých organismů bylo nutné vytvořit databázi promotorových sekvencí. Největší databází eukaryotických promotorových sekvencí (hlavně obratlovců) je databáze eukaryotických promotorů [12] . Databáze je rozdělena na dvě části. První (EPD) je upravený soubor promotorových sekvencí získaných zpracováním experimentálních dat, druhý (EPDnew) je výsledkem sloučení informací o promotoru z databáze EPD s analýzou dat z vysoce výkonných sekvenačních metod. Pomocí vysoce výkonných metod získávání transkriptomů se podařilo získat sadu promotorů pro některé zástupce rostlin a hub: Arabidopsis thaliana (Tal's coli), Zea mays (kukuřice cukrová), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .

Poznámky

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Watson JD, Baker TA, Bell SP, Gann AA, Levine M., Losick RM Molecular Biology of the  Gene . — 7. — Pearson, 2014.
  2. 1 2 Pedersen Anders Gorm , Baldi Pierre , Chauvin Yves , Brunak Søren. Biologie predikce eukaryotického promotoru – přehled  //  Computers & Chemistry. - 1999. - Červen ( roč. 23 , č. 3-4 ). - S. 191-207 . — ISSN 0097-8485 . - doi : 10.1016/S0097-8485(99)00015-7 .
  3. 1 2 3 4 5 Solovyev Victor V. , Shahmuradov Ilham A. , Salamov Asaf A. Identifikace promotorových regionů a regulačních míst  (anglicky)  // Methods in Molecular Biology. - 2010. - S. 57-83 . — ISBN 9781607618539 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60761-854-6_5 .
  4. Wingender E. TRANSFAC: databáze transkripčních faktorů a jejich vazebných míst pro DNA  //  Nucleic Acids Research. - 1996. - 1. ledna ( roč. 24 , č. 1 ). - str. 238-241 . — ISSN 1362-4962 . doi : 10.1093 / nar/24.1.238 .
  5. David Ghosh. Relační databáze transkripčních faktorů  //  Nucleic Acids Research. - 1990. - Sv. 18 , č. 7 . - S. 1749-1756 . — ISSN 0305-1048 . - doi : 10.1093/nar/18.7.1749 .
  6. Databáze RegSite . SoftBerry . Získáno 7. dubna 2019. Archivováno z originálu dne 22. října 2019.
  7. de Jong Anne , Pietersma Hilco , Cordes Martijn , Kuipers Oscar P , Kok Jan. PePPER: webový server pro predikci prokaryotních promotorových prvků a regulonů  //  BMC Genomics. - 2012. - Sv. 13 , č. 1 . — S. 299 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-13-299 .
  8. Scherf Matthias , Klingenhoff Andreas , Werner Thomas. Vysoce specifická lokalizace promotorových oblastí ve velkých genomových sekvencích pomocí PromoterInspector: nový přístup k analýze kontextu  //  Journal of Molecular Biology. - 2000. - březen ( roč. 297 , č. 3 ). - S. 599-606 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.2000.3589 .
  9. Robison Keith , McGuire Abigail Manson , Church George M. Komplexní knihovna matric vazebných míst DNA pro 55 proteinů aplikovaných na kompletní genom Escherichia coli K-12 1 1Editoval R. Ebright  //  Journal of Molecular Biology. - 1998. - Listopad ( roč. 284 , č. 2 ). - str. 241-254 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1998.2160 .
  10. Burden S. , Lin Y.-X. , Zhang R. Zlepšení predikce promotoru Zlepšení predikce promotoru pro algoritmus NNPP2.2: případová studie využívající sekvence DNA Escherichia coli   // Bioinformatika . - 2004. - 28. září ( roč. 21 , č. 5 ). - S. 601-607 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti047 .
  11. Di Salvo Marco , Pinatel Eva , Talà Adelfia , Fondi Marco , Peano Clelia , Alifano Pietro. G4PromFinder: Algoritmus pro predikci transkripčních promotorů v bakteriálních genomech bohatých na GC založený na elementech bohatých na AT a motivech G-kvadruplexů  //  BMC Bioinformatics. - 2018. - 6. února ( roč. 19 , č. 1 ). — ISSN 1471-2105 . - doi : 10.1186/s12859-018-2049-x .
  12. Cavin Perier R. The Eukaryotic Promoter Database EPD  //  Nucleic Acids Research. - 1998. - 1. ledna ( roč. 26 , č. 1 ). - str. 353-357 . — ISSN 1362-4962 . doi : 10.1093 / nar/26.1.353 .
  13. Dreos René , Ambrosini Giovanna , Groux Romain , Cavin Périer Rouaïda , Bucher Philipp. Databáze eukaryotických promotorů ve svém 30. roce: zaměření na organismy bez obratlovců  //  Nucleic Acids Research. - 2016. - 28. listopadu ( roč. 45 , č. D1 ). -P.D51- D55 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkw1069 .