STARR-Seq ( self-transscription active regulator region sequencing ) je metoda pro analýzu enhancerové aktivity milionů sekvencí DNA současně z genomů libovolných organismů . STARR-seq má vysoký výkon a může být použit pro celogenomové vyhledávání a kvantifikaci aktivity zesilovače [1] .
U eukaryot je transkripce regulována transkripčními faktory - proteiny , které se vážou na specifické oblasti DNA v genových promotorech , stejně jako na oblasti, které nejsou umístěny v těsné blízkosti genů, včetně zesilovačů . Enhancery jsou nekódující oblasti DNA obsahující specifická vazebná místa pro různé transkripční faktory [2] . Zesilovače získávají transkripční faktory, které aktivují RNA polymerázu II a obecné transkripční faktory v blízkosti promotoru, což vede k transkripci genu. Enhancery mohou regulovat transkripci cílových genů tkáňově specifickým způsobem [1] bez ohledu na jejich umístění v DNA a vzdálenost od promotoru genu. V některých případech mohou regulovat transkripci genů umístěných na jiném chromozomu [3] . Doposud se však informace omezovaly na studium malého počtu enhancerů kvůli složitosti jejich celogenomového vyhledávání [2] . Navíc mnoho regulačních prvků funguje výhradně ve specifických typech buněk a za určitých podmínek [4] .
Ke stanovení zesilovačů u Drosophila se používá technika využívající náhodné inzerce transpozonu kódujícího minimální promotor s reportérovým proteinem . Tato metoda poskytuje informace o regulaci genů umístěných v blízkosti místa inzerce zesilovači [5] .
V posledních několika letech byly pomocí postgenomických technologií studovány různé vlastnosti aktivních a neaktivních zesilovačů. Vývoj nových metod, jako je DNase-seq , FAIRE-Seq , ChIP-seq , umožnil předpovědět pozici enhancerů v genomu. Nicméně DNase-seq a FAIRE-seq neumožňují přímé stanovení enhanceru a jeho aktivity. Kromě toho tyto způsoby nemohou testovat velký počet kandidátních sekvencí na přítomnost enhancerové aktivity. Vývoj STARR-seq umožňuje provádět celogenomové hledání enhancerů a kvantifikovat jejich aktivitu [1] .
Myšlenka STARR-seq byla navržena v laboratoři A. Starka (A. Stark, Institute of Molecular Pathology , Vídeň , Rakousko ) pro celogenomové hledání enhancerů libovolných organismů, stejně jako kvantitativní stanovení jejich aktivity. Metoda je založena na skutečnosti, že zesilovače mohou fungovat bez ohledu na jejich relativní umístění na DNA. Podstata metody spočívá v umístění potenciálního enhanceru za minimálním promotorem, což umožňuje aktivnímu enhanceru aktivovat transkripci DNA obsahující vlastní sekvenci. Aktivita každého zesilovače je charakterizována stupněm obohacení RNA o sekvenci zesilovače mezi všemi buněčnými RNA. Pomocí tohoto přístupu je možné současně kontrolovat miliony řezů DNA z libovolného zdroje [1] .
Genomová DNA je náhodně rozdělena na malé fragmenty. Vyberou se fragmenty určité délky, na ně se ligují adaptéry. Fragmenty DNA s adaptéry jsou poté amplifikovány . Produkty PCR jsou purifikovány a vloženy do plazmidu za minimálním promotorem v 3'-nepřekládané oblasti reportérového genu, což umožňuje aktivnímu zesilovači aktivovat transkripci RNA polymerázou oblasti DNA obsahující za počátečním bodem transkripce sekvenci. samotného zesilovače. Buňky jsou poté transfekovány výslednou reportérovou knihovnou a kultivovány. Polyadenylovaná RNA se izoluje z celkové RNA a cDNA se získá reverzní transkripcí , která se amplifikuje, načež je sekvence fragmentů rozpoznána sekvenováním na párových koncích . Sekvenované fragmenty jsou mapovány do referenčního genomu a data jsou odeslána k počítačovému zpracování [1] .
Metoda STARR-seq byla původně aplikována na genom Drosophila . Bylo zjištěno, že většina (55,6 %) zesilovačů se nachází v intronech , zejména v prvním intronu, a intergenových oblastech. Zajímavé je, že malá část (4,5 %) enhancerů je umístěna v místech startu transkripce, a proto lze předpokládat, že tyto enhancery mohou jak zahájit transkripci v tomto místě, tak ovlivnit transkripci jiných genů. Nejaktivnější zesilovače jsou umístěny v blízkosti konstitutivních genů , jako jsou ty, které kódují cytoskeletální proteiny , a některých vývojových regulátorů, jako jsou transkripční faktory. Autoři ukázali, že mnoho genů je regulováno několika nezávislými aktivními zesilovači. Navíc se ukázalo, že hladiny genové exprese v průměru korelují s celkovou aktivitou zesilovače na gen, což poskytuje přímý vztah mezi úrovní exprese a aktivitou zesilovače [1] .
Pomocí STARR-seq k hledání a charakterizaci variant regulačních alel objevili Vockey et al účinky lidské genetické variace na funkci nekódujících regulačních elementů měřením aktivity 100 domnělých zesilovačů z genomů 95 jedinců. Tento přístup umožňuje identifikovat regulační varianty (včetně SNP ) lokalizované v genomových lokusech , které přispívají ke změnám v hladinách exprese různých mRNA ( eQTL ), a také přispívají ke komplexním fenotypům [7] .
Metoda STARR-seq má následující výhody:
STARR-seq kombinuje klasické metody molekulární biologie s vysoce specializovanými bioinformatickými metodami pro detekci a kvantifikaci enhancerové aktivity. Dosud byl STARR-seq aplikován v myších a lidských buňkách a jeho účinnost byla potvrzena [8] . Aplikace STARR-seq na různé typy buněk různých organismů umožní učinit významný krok ve studiu genové regulace a signálních drah , které jsou za ni odpovědné během vývoje a diferenciace buněk , za normálních i patologických podmínek [6] ] .