ChIP seq

ChIP-seq je  metoda analýzy interakce DNA - protein založená na imunoprecipitaci chromatinu (ChIP) a vysoce výkonném sekvenování DNA . Metoda byla vyvinuta pro studium modifikací histonů v celém genomu [1] [2] a také pro hledání vazebných míst pro transkripční faktor [3] . Dříve nejoblíbenější metodou pro stanovení interakcí DNA-protein byl ChIP-on-chip , který kombinuje imunoprecipitaci chromatinu s hybridizací na DNA mikročipech [4] .

Metodika

Chromatinová imunoprecipitace (ChIP)

Chromatinová imunoprecipitace  je technika používaná pro specifickou akumulaci krátkých sekvencí DNA spojených se zájmovým proteinem v živých buňkách [5] . Typická technika zahrnuje následující kroky [5] :

Díky tomu bude veškerá DNA izolována, ale vzorek bude obohacen o fragmenty, se kterými byl studovaný protein asociován [5] .

Sekvenování

Tato fáze zahrnuje stanovení primární sekvence získané po imunoprecipitaci fragmentů DNA jakoukoli dostupnou metodou. Na rozdíl od ChIP-on-Chip využívá ChIP-seq sekvenování nové generace k určení sekvence DNA [6] . V ChIP-seq se častěji používá jednokoncové sekvenování, ale použití oboustranného sekvenování zvyšuje přesnost mapování (což je důležité zejména pro opakované mapování ) [7] . Výsledkem je sada krátkých překrývajících se sekvencí (čtení nebo čtení). Typicky jsou původní fragmenty DNA dlouhé 150–500 bp. a výsledná čtení mají nejčastěji délku 50 bp. [7]

Bioinformatická analýza

Bioinformatická analýza zahrnuje následující fáze [5] :

K filtrování přijatých odečtů můžete použít softwarové balíčky FastQC a FastX ToolKit [8] . Definice kvality čtení je založena na skóre kvality Phred  - váha, která je přiřazena každému nukleotidu při jeho čtení. Softwarové balíčky jako Gencore , FQStat , Picard a Cutadapt lze použít k vyhodnocení a zlepšení kvality čtení. Gencore odstraňuje duplicitní čtení a ponechává jedno čtení konsensu. Výsledkem jsou čistší data než pouhé odstraňování duplikátů. Picard je sada nástrojů, která vám umožňuje pracovat s alternativními formáty: SAM / BAM / CRAM a VCF. FQStat je samostatný softwarový balík nezávislý na platformě, který vyhodnocuje kvalitu souborů FASTQ pomocí paralelního programování. Kromě toho bude společnost Illumina poskytovat vlastní službu zajištění kvality čtení s filtrem cudnosti Illumina. Ke zlepšení kvality čtení může být také užitečné „ořezávání“ – ořezávání konců nekvalitních čtení vyplývajících z neshody (funkce sekvenování nové generace). Trimování se provádí pomocí programu Trimmomatic [9] . Mapování je určení, která konkrétní oblast a který chromozom byl přečten daným konkrétním čtením. K mapování čtení do genomu lze použít softwarové balíčky jako BWA , Bowtie , Bowtie 2 a GSNAP [6] . Čtení vyplývající z masivního paralelního sekvenování jsou obvykle krátká (100-200 nukleotidů ), zatímco průměrný eukaryotický chromozom je asi 100 milionů nukleotidů. Mapování čtení do genomu není vždy triviální úkol kvůli přítomnosti velkého počtu repetic v eukaryotickém genomu (například LINE a SINE  jsou repetice, které tvoří 17 % a 11 % sekvence lidské DNA ), a tak mohou být opakované odečty mapovány na několika místech najednou. Obvykle jsou pro analýzu dostačující jedinečně mapovaná čtení (například transkripční faktory ), ale v některých případech jsou do analýzy zahrnuta i čtení mapovaná do několika oblastí [7] . Alternativně ke korekci ztráty signálu ve špatně zmapovaných oblastech lze použít mapování, indikátor, který závisí na různých experimentálních a analytických parametrech, včetně délky čtení a programů používaných pro zpracování dat [10] . K filtrování lze použít softwarový balík SAMTools [11] [6] . Po mapování je možné určit vazebná místa studovaného proteinu v genomu podle počtu čtení mapovaných na toto místo (pokud jich je mnoho, protein tam byl) [6] . Soubor odečtů získaných jako výsledek imunoprecipitace může být neúspěšný pro další analýzu kvůli nedostatečné hloubce sekvenování, špatnému výběru velikosti fragmentů, na které byla DNA štěpena během imunoprecipitace, nebo nedostatečnému zastoupení fragmentů asociovaných s proteinem pod studie ve směsi získané po imunoprecipitaci (špatné protilátky atd.). . P.). K určení všech výše uvedených skutečností se používá softwarový balík CHANCE [8] . Po mapování odečtů do genomu pro identifikaci vazebných míst (oblastí) se nejprve vyhodnotí úroveň pokrytí. Dále se identifikují píky (oblasti s velkým pokrytím, kde byl pravděpodobně navázán studovaný protein), oddělí se šum a určí se hranice píků. Je důležité udržovat rovnováhu mezi senzitivitou a specificitou [8] . Některé ze softwarových balíků, které lze použít k vyřešení tohoto problému, jsou SPP , PeakSeq [10] , MACS , MACS 2, UGENE [6] . Výsledkem práce těchto programů je seznam regionů seřazený buď podle velikosti absolutního signálu (tedy počtu čtení) nebo podle významnosti obohacení (například podle hodnoty p nebo FDR ). Výběr vhodné metody závisí na studovaném druhu a proteinu a na experimentálních podmínkách. Různé programy používají různé předpoklady a předpoklady pro výpočet p-hodnoty a FDR. Například SPP a původní verze MACS používají pouze data z experimentu a kontroly ChIP-Seq (pokud jsou k dispozici), zatímco MOSAiCS bere v úvahu skóre mapovatelnosti a složení GC . Proto je poměrně obtížné porovnávat výsledky různých algoritmů pro volání píku. Mnoho článků o párování algoritmů používá ověření počtu nalezených píku pomocí dat z experimentů ChIP-on-Chip, qPCR atd. [12] [13] [14] . Situaci komplikuje i špatná anotace skutečných vazebných míst, takže při hledání píku pro protein s neznámým vazebným místem je nutné použít negativní kontroly [7] . Účelem anotace je vytvořit spojení mezi vazebným místem a funkční oblastí DNA, na které vazebné místo přistálo. Takovým funkčním místem může být promotor , místo startu transkripce , intergenní místo atd. [6] . Průsečík předpokládaných vazebných míst s funkčními prvky DNA lze vizuálně analyzovat v jednom z genomických prohlížečů ; můžete také získat anotovaný textový soubor pomocí Diffbind , CEAS nebo ChIPpeakAnno [8] . V získaných vrcholech (délka řádově stovky nukleotidů) lze někdy identifikovat charakteristické sekvence, podél kterých dochází k vazbě proteinů – motivy (obvykle o délce cca 20 nukleotidů). Pro vyhledávání motivů můžete použít MEME algoritmus , Gibbs sampler [8] , ChIPMunk . Pokud je vazebný motiv pro studovaný protein již znám, pak jeho přítomnost v pících může sloužit jako dobrý indikátor kvality ChIP-seq [8] .

Charakteristika metody

Při navrhování experimentu ChIP-seq a další bioinformatické analýzy je nutné vzít v úvahu některé faktory a omezení techniky [7] :

Nepravidelná fragmentace a kontrola

Dostupnost chromatinu během fragmentace není v různých částech genomu stejná: je dostupnější v aktivně transkribovaných oblastech, takže ve vzorku budou převažovat odpovídající fragmenty DNA, což může vést k falešně pozitivnímu výsledku. Naproti tomu hustě sbalené oblasti mohou být méně náchylné k fragmentaci, a proto mohou být ve vzorku méně zastoupeny, což může vést k falešně negativnímu výsledku [7] .

Kvůli nerovnoměrné fragmentaci a dalším faktorům je důležité používat správné ovládání. Konsorcium ENCODE popisuje dva hlavní typy ovládacích prvků [15] . V první variantě se jako kontrola používá DNA izolovaná z buněk za stejných podmínek, ale bez precipitace (tzv. vstupní kontrola DNA). U druhého typu se provádí další ChIP experiment s použitím protilátek, které vážou nevýznamné extranukleární antigeny (tzv. „IgG kontrola“). V obou případech by hloubka sekvenování neměla být menší než hloubka experimentu ChIP-seq [15] .

Počet buněk

Klasická technika má řadu omezení. ChIP tedy obvykle vyžaduje značný počet buněk (asi 10 milionů), což ztěžuje aplikaci této metody na malé modelové organismy a také omezuje počet experimentů, které lze provést s cenným vzorkem. K překonání tohoto omezení byla vyvinuta řada metod založených na amplifikaci DNA po ChIP-seq (např. nano-ChIP-seq). ChIP-seq jednotlivých buněk ( ang.  Single-cell ChIP-seq ) je velmi složitý kvůli šumu pozadí způsobenému nespecifickou vazbou protilátek a do poloviny druhé dekády 21. století byla publikována pouze jedna práce ve kterém byl úspěšně proveden Single-cell ChIP-seq. Tato studie používala kapkovou mikrofluidiku a kvůli nízkému pokrytí bylo nutné sekvenovat tisíce buněk, aby se odhalila buněčná heterogenita [16] .

Poměr signálu k šumu

Poměr signálu k šumu (S/N) je určen počtem a výkonem vrcholů získaných pro každý vzorek a lze jej použít k odhadu úrovně šumu. Vysoká hodnota S/N nezaručuje správné určení vazebných míst, ale odráží pouze přítomnost velkého počtu oblastí genomu, do kterých bylo mapováno mnoho čtení [7] . K určení tohoto indikátoru nabízí ENCODE dvě metriky [15] :

Hloubka sekvenování

Hloubka sekvenování (pokrytí) je počet jedinečných čtení mapovaných do dané oblasti referenčního genomu. Hloubka sekvenování ovlivňuje detekci píků: jejich počet se zvyšuje s rostoucí hloubkou sekvenování, protože s nárůstem počtu čtení se větší počet míst stává statisticky významným [17] . K rozpoznání všech funkčních míst je proto nutné hluboké sekvenování [7] .

Hodnota dostatečné úrovně pokrytí závisí na poměru signálu k šumu protilátky a lze ji definovat jako hloubku sekvenování, ve které je poměr počtu píků z náhodné podmnožiny čtení k počtu píků z plná sada čtení dosáhne plošiny. Takové saturace nemusí být vždy dosaženo (například u histonů neexistuje ) a v takových případech je tato hodnota stanovena empiricky [7] .

Složitost knihovny

Složitost knihovny (NRF) je definována jako poměr počtu neobohacených čtení N nečervených k celkovému počtu mapovaných čtení N všech . Neobohacená čtení jsou definována jako čtení mapovaná do stejné oblasti genomu Tkrát nebo méně (hodnota T je uvedena jako parametr). Obohacená čtení (čtení nezahrnutá v N nonred ) se v další analýze neberou v úvahu. U člověka se parametr T obvykle rovná 1, protože očekávaná hloubka sekvenování je v tomto případě obvykle mnohem menší než jedna. U malých genomů může být hloubka sekvenování větší než 1, proto se vyplatí vzít větší hodnotu T. Při porovnávání NRF pro různé vzorky je vhodné pamatovat na to, že závisí na celkovém počtu mapovaných čtení [7] .

NRF se snižuje s rostoucí hloubkou sekvenování knihovny. To nakonec dosáhne bodu, kdy bude složitost maximální a dojde k sekvenování stejných fragmentů DNA amplifikovaných pomocí PCR . Nízká složitost knihovny může nastat například tehdy, pokud se během imunoprecipitace uvolní velmi málo DNA [15] .

Citlivost

Citlivost technologie závisí na hloubce sekvenování, délce genomu a dalších faktorech. Pro transkripční faktory savců a modifikace chromatinu spojené s enhancerem, které jsou obvykle lokalizovány do specifických úzkých míst a mají řádově tisíc vazebných míst, bude dostačujících asi 20 milionů čtení [6] . Proteiny s velkým počtem vazebných míst ( RNA polymeráza III ) vyžadují až 60 milionů čtení [6] . V případě transkripčních faktorů červů nebo much je potřeba přibližně 4 miliony čtení [6] . Náklady na sekvenování fragmentů získaných po imunoprecipitaci přímo korelují s hloubkou sekvenování. Pokud je požadováno zobrazení vazebných míst proteinů, které se často nacházejí ve velkém genomu, s vysokou citlivostí, budou vyžadovány vysoké náklady, protože bude nutný velký počet čtení. To odlišuje tuto metodu od ChIP-on-Chip, ve které citlivost nesouvisí s náklady na analýzu [6] .

Dalším rozdílem od ChIP metod založených na DNA microarrays je to, že přesnost ChIP-seq není omezena vzdáleností mezi danými sondami. Integrací velkého počtu krátkých čtení lze získat lokalizaci vazebných míst s vysokou přesností. Ve srovnání s metodami ChIP-on-Chip lze data ChIP-seq použít k lokalizaci skutečného vazebného místa pro protein s přesností na desítky nukleotidů. Hustota čtení na vazebných místech je dobrým indikátorem síly vazby protein-DNA, což usnadňuje kvantifikaci a srovnání proteinové afinity pro různá místa [18] .

Přesnost a specifičnost

Délka typického vazebného místa pro protein je 6–20 nukleotidů a délka získaných fragmentů po ChIP je asi 200, což činí stanovení vazebného místa nepříliš přesným. Kromě toho mohou výsledné knihovny často obsahovat oblasti DNA, které nejsou spojeny se studovaným proteinem, což vede k chybám ve výsledcích. Existují různé modifikace metody zaměřené na zlepšení přesnosti (například ChIP-exo). Kvalita ChIP-seq experimentu také přímo závisí na specificitě protilátek a stupni obohacení vzorku ve fázi imunoprecipitace. Hlavními problémy mohou být nízká reaktivita protilátky proti požadovanému proteinu a/nebo zkřížená reaktivita s jinými proteiny. Konsorcium ENCODE nabízí několik metod pro hodnocení specificity protilátek [15] .

Epitop může být také fúzován k proteinu zájmu za účelem provedení imunoprecipitace . Tato metoda řeší oba problémy, které vznikají při imunoprecipitaci protilátek, nicméně v tomto případě může připojená značka ovlivnit studovaný protein (například změnit úroveň jeho exprese nebo vazebnou schopnost) [15] .

Alternativní metody

Chip-on-chip

ChIP-on-chip , kombinující imunoprecipitaci chromatinu s hybridizací na DNA microarrays [4] , byl dříve nejoblíbenější metodou pro stanovení interakcí DNA-protein. Chip-seq a ChIP-on-chip jsou dva nejpoužívanější přístupy v genomových studiích interakcí DNA-protein in vivo. Podrobnější srovnání těchto metod však ukazuje významné výhody Chip-seq [4] . Porovnání metod Chip-seq a ChIP-on-Chip je uvedeno v tabulce [4] :

Index ChIP seq Chip-on-Chip
Množství původní DNA méně než 10 ng 4 mcg
Flexibilita metody ano: analýza celého genomu jakéhokoli sekvenovaného organismu existují omezení: dostupnost DNA mikročipů
Přesnost určení polohy vazebného místa +/- 50 měs +/- 500 − 1000 měs
Citlivost proměnná: zvýšením počtu čtení můžete zvýšit citlivost slabé: závisí na kvalitě hybridizace
Cross-hybridizace (hybridizace jednovláknové DNA se sondou, která je k ní částečně komplementární) vyloučeno: každá molekula DNA je sekvenována samostatně mohou být významné, což značně snižuje přesnost analýzy

DamID

DamID (identifikace DNA adenin methyltransferázy) umožňuje mapování míst interakcí DNA-protein v eukaryotických buňkách. Za tímto účelem buňky exprimují chimérický protein , sestávající ze sledovaného proteinu a E. coli adenin methyltransferázy (Dam) DNA , která methyluje adeniny v sekvenci GATC. U většiny eukaryot nedochází k endogenní methylaci adeninu v místech GATC. Když se požadovaný fúzní protein Dam naváže na DNA nebo jiné proteiny asociované s DNA, Dam methyluje zbytky adeninu v DNA obklopující vazebné místo, takže tato metoda umožňuje značení míst interakce cílového proteinu s DNA a asociovanými s DNA. proteiny. K identifikaci sekvencí metylovaných chimérickým proteinem jsou methylované fragmenty selektivně amplifikovány a hybridizovány na mikročipech [19] .

Selektivní amplifikace metylovaných fragmentů DNA je založena na speciálním protokolu PCR. Nejprve je DNA methylovaná v místech GATC štěpena mezi nukleotidy GAm a TC restrikčním enzymem DpnI . Štěpení pomocí DpnI vede k tvorbě fragmentů DNA s tupými konci 5'TC a 3'GAm . Poté se k získaným fragmentům ligují dvouvláknové adaptéry . Produkty ligace jsou poté štěpeny restrikční endonukleázou DpnII . DpnII štěpí DNA na nemethylovaných místech GATC, takže jsou následně amplifikovány pouze fragmenty lemované postupně methylovanými místy GATC (tj. místy, mezi kterými se nevyskytují žádná nemethylovaná místa GATC). Poté se provede PCR s primery komplementárními k adaptérům, a tak se specificky amplifikují genomové fragmenty s metylovanými místy GATC na okrajích [20] .

Modifikace metod

Od vynálezu ChIP-Seq bylo vynalezeno mnoho modifikací této metody, které umožňují efektivnější provádění jednoho nebo druhého dílčího úkolu.

ChIA-PET

Tato metoda se používá ke stanovení interakcí oblastí chromatinu umístěných ve značné vzdálenosti od sebe v genomu [21] . ChIA-PET je založen na teorii proximální ligace (proximální ligace ), která říká, že konce oblastí chromatinu spojených s proteinovým komplexem, které jsou v blízkosti, budou k sobě ligovány s větší pravděpodobností než konce oblasti, které jsou v roztoku nebo spojené s jiným proteinovým komplexem.

PLAC seq

Existuje mnoho metod pro studium interakcí chromatinu na dlouhé vzdálenosti, ale pro analýzu vyžadují velké množství buněk. K překonání tohoto omezení byla vyvinuta metoda PLAC-seq (Proximity Ligation-Assisted ChIP-seq), ve které se zesíťování souvislých oblastí provádí v jádře před fragmentací chromatinu a imunoprecipitací. PLAC-seq prokazuje vynikající přesnost, výkon a reprodukovatelnost ve srovnání s ChIA-PET při určování kontaktů na velké vzdálenosti v savčích buňkách [22] .

Nano-ChIP seq

Metoda nano-ChIP-seq je založena na skutečnosti, že DNA izolovaná během experimentu ChIP je amplifikována pomocí PCR a následně sekvenována [23] . To umožňuje provádět analýzu na malém počtu buněk, typicky kolem 10 000. Dostatečný počet buněk však závisí na mnoha faktorech, jako je účinnost protilátek a obohacení vzorku o cílový protein, takže v některých případech může být potřeba více než 10 tisíc buněk [23] .

ChIP-exo a ChIP-nexus

Metoda ChIP-exo  je modifikací protokolu ChIP-seq, která zlepšuje rozlišení nalezených vazebných míst od stovek párů bází až po téměř jeden nukleotid. ChIP-exo používá λ-exonukleázu k odstranění kontaminující DNA a 5' konců DNA fragmentů spojených s cílovým proteinem až do polohy v určité pevné vzdálenosti od vazebného místa proteinu [24] . Protože fragmenty DNA obou řetězců jsou tvořeny jako výsledek experimentu ChIP, jsou zarovnané 5' konce mapovány do dvou poloh genomu, mezi nimiž se nachází vazebné místo pro protein. Experimenty s kvasinkami ukázaly, že ChIP-exo umožňuje identifikaci vazebných míst s nukleotidovou přesností a 40krát vyšším poměrem signálu k šumu ve srovnání s ChIP-seq a ChIP-on-Chip [24] .

Modifikací protokolu ChIP-exo je protokol ChIP-nexus [25] (ChIP experimenty s rozlišením nukleotidů exonukleázou, unikátním čárovým kódem a jednoduchou ligací). V tomto protokolu jsou k DNA ligovány speciální adaptéry, které obsahují pár sekvencí pro amplifikaci knihovny, místo restrikčního enzymu BamHI a randomizovaný čárový kód , který umožňuje sledování nadměrné amplifikace fragmentů. Stejně jako v protokolu ChIP-exo se provádí ošetření λ-exonukleázou, která štěpí DNA od 5'-konce na fyzickou překážku v podobě proteinu vázaného na DNA. Poté se provede intramolekulární cirkularizace DNA a poté relinearizace působením restrikčního enzymu BamHI [25] . Na okrajích požadovaného fragmentu jsou tedy sekvence pro amplifikaci. Tento další krok zlepšuje účinnost začlenění fragmentů DNA do knihovny [25] .

Competition-ChIP

Competition-ChIP  je modifikací protokolu ChIP-seq používaného k měření relativní dynamiky vazby transkripčního faktoru na DNA [26] . Myšlenka metody je založena na expresi dvou kopií studovaného transkripčního faktoru s různými epitopovými značkami . Jedna z těchto kopií je vyjádřena trvale a vyjádření druhé, vystupující jako konkurent, je indukovatelné. Poměr izoforem asociovaných s určitými lokusy je určen buď pomocí ChIP-seq nebo ChIP-on-chip. Rychlost, s jakou je konstitutivně exprimovaná forma nahrazena indukovatelnou, umožňuje vypočítat dobu zdržení studovaného faktoru na každém vazebném místě.

CLIP seq

CLIP-seq (také známý jako HITS-CLIP  - vysokokapacitní sekvenování RNA izolované pomocí křížové imunoprecipitace) je metoda pro studium interakcí RNA-protein a modifikací RNA in vivo [27] .

DRIP-seq a DRIVE-seq

R-smyčky jsou třívláknové struktury tvořené vytěsněnou jednovláknovou DNA (ssDNA) a duplexem RNA-ssDNA . In vivo tvoří přibližně 5–8 % genomu. Prostřednictvím regulace vazby různých proteinů se R-smyčky účastní mnoha buněčných procesů, jako je například diferenciace embryonálních kmenových buněk [28] . Pro studium R-smyček byla vyvinuta metoda DRIP-seq (DNA:RNA ImmunoPrecipitation and sequencing), která je v podstatě velmi podobná ChIP-Seq, ale je založena na použití protilátek specifických pro R-smyčky [29 ] . Dalším způsobem, jak studovat R-smyčky, je metoda DRIVE-seq (DNA:RNA In Vitro Enrichment and sequencing), která místo protilátek využívá inaktivovanou endonukleázu MBP-RNASEH1 [29] . DRIVE-seq lze použít k upřesnění předpovědí vytvořených pomocí DRIP-seq. Obě metody umožňují přesně a prakticky kvantifikovat počet R-smyček. Poprvé byl DRIP-seq použit ke studiu R-smyček v lidském genomu: ukázalo se, že velké množství z nich je obsaženo v CpG ostrůvcích promotorů [29] .

CETCh-seq

Metoda CETCh-seq byla navržena k překonání takového technického problému, jako je dostupnost protilátek vhodných pro experimenty ChIP-seq při studiu interakcí DNA-protein. Pomocí genomové editace pomocí CRISPR/Cas9 je k požadovaným proteinům přidán epitop , jako jsou transkripční faktory, pro další rozpoznání vhodnými protilátkami [30] .

STŘÍHAT&RUN

CUT&RUN  je modifikace ChIP-seq, která umožňuje výrazně zvýšit odstup signálu od šumu. Účinek je dosažen použitím mikrokokové nukleázy fúzované s proteinem A ve fázi imunoprecipitace [31] .

CUT&Tag

CUT&Tag  je metoda podobná CUT&RUN, ale místo mikrokokové nukleázy je použitaTn5 transposáza . Výhodou této metody oproti CUT&RUN je, že nevyžaduje buněčnou lýzu a frakcionaci chromatinu [32] .

Aplikace

ChIP-seq je v zásadě použitelný pro jakékoli proteiny, které se vysrážejí během imunoprecipitace chromatinu. Typickým příkladem použití metody ChIP-seq je stanovení vazebných míst pro transkripční faktory, DNA polymerázu , strukturní proteiny, ale i modifikace histonů a strukturu chromatinu [6] . Jako alternativa k ChIP-seq byla vyvinuta řada neimunoprecipitačních metod ( DNase-Seq a FAIRE-Seq ) k detekci oblastí DNA bez nukleozomů [6] .

Hledání motivů

Jedním z hlavních cílů ChIP-seq experimentů je hledání motivů sekvence DNA pro vazbu proteinů. Oblasti DNA, které jsou fyzicky v kontaktu s transkripčními faktory a jinými proteiny, lze izolovat imunoprecipitací chromatinu. Během experimentu se získá soubor fragmentů DNA asociovaných se studovaným proteinem in vivo . Další analýza zahrnuje použití masivního paralelního sekvenování a celogenomových databází k určení pozice vazebných míst v genomu [6] . Nejpoužívanějším nástrojem pro detekci motivů je algoritmus MEME (Multiple EM for Motif Elicitation). Často lze nalézt mnoho motivů na základě jediného souboru dat a analýzu motivů lze provést i na datech ChIP-seq nízké kvality, ale významnost a spolehlivost takových motivů bude nižší [33] .

Hledání lokalit s biologickou funkcí

Data z experimentů ChIP-seq se často používají k identifikaci regulačních oblastí pro lokus zájmu [15] . Zejména ChIP-seq je široce používán ke studiu bakteriálních regulonů [34] . Za tímto účelem se po nalezení vazebných míst provede hledání domnělých regulovaných genů [34] .

Diferenciální analýza

Rozdíly mezi profily ChIP-Seq za různých podmínek jsou určeny po vyvolání píku. Píky získané v různých experimentech jsou poté sloučeny do jednoho seznamu. K další identifikaci kandidátních míst se často používají programy pro analýzu diferenciální genové exprese , jako je DESeq2 [35] a edgeR [36] . Tyto programy jsou schopny provádět diferenciální analýzu tím, že se seznamy výsledných píku nakládají jako se seznamy "genů". Existují také programy určené speciálně pro diferenciální analýzu dat ChIP-Seq (např. DiffBind [37] , ChIPComp [38] , DBChIP [39] ), které fungují na podobném principu. Mnoho dalších programů (například PePr [40] ) používá modely, které nevyžadují předběžné volání špiček [40] .

Studium stavu chromatinu

Metylace DNA a modifikace histonů procházejí silnými změnami během vývojových přechodů a u nemocí, jako je rakovina, a významně tak přispívají k dynamické povaze chromatinu. Různé histonové modifikace se zkoumají pomocí specifických protilátek, aby se získal profil histonových značek ve vzorku. Ve svých vlastních experimentech konsorcium ENCODE pečlivě testuje specifitu použitých protilátek na různé různě modifikované histonové koncové peptidy. Běžné buněčné zdroje jsou také použity a profilovány a porovnávány, aby byla zajištěna konzistence mezi experimenty. Aktuální pokyny konsorcia ENCODE pokrývají validaci protilátek, experimentální reprodukovatelnost, hloubku sekvenování, analýzu kvality dat a publikaci dat a metadat [33] [41] .

Analýza alelické nerovnováhy

Stále větší zájem je o analýzu dat ChIP-Seq s vnitřní kontrolou pro jinou alelu k identifikaci alelické nerovnováhy [42] . Zároveň jsou data získaná z experimentu ChIP-Seq využívána k hledání vztahu biologických signálů s jednonukleotidovými polymorfismy (SNP) [42] . Tato analýza zahrnuje tři fáze [43] :

  1. zarovnání čtení, to znamená určení pozice v genomu a alely pro každé čtení,
  2. počítání počtu spolehlivě mapovaných čtení pro každý SNP pro každou alelu,
  3. klasifikace možných SNP a statistické hodnocení alelické nerovnováhy.

Pro první dvě fáze je důležitá správná strategie mapování čtení do referenčního genomu, protože je nutné odlišit chyby sekvenování od skutečných alel. Pro třetí fázi bylo vyvinuto několik programů využívajících různé statistické testy, jako je AlleleDB [44] , NPBin [42] a WASP [45] .

Databáze

Genom mnohobuněčných organismů je extrémně složitý a není zcela do detailu jasné, jak dochází k implementaci dědičné informace. Podrobné pochopení fungování genomu vyžaduje úplný seznam funkčních prvků a popis toho, jak fungují v průběhu času a v různých typech buněk. Ve snaze vyřešit tento problém vznikly projekty ENCODE a modENCODE [46] . Kromě výsledků ChIP-seq integrují ENCODE a modENCODE data z analýz, jako je 5C a ChIA-PET , aby se určila konformace chromozomů; DNase-seq a FAIRE-Seq k identifikaci oblastí bez nukleozomů; bisulfitové sekvenování a Infinium Methylation Assay pro stanovení přítomnosti methylcytosinů v DNA, RT-PCR a RNA sekvenování pro stanovení úrovně genové exprese, stejně jako CLIP-seq a RIP-seq pro identifikaci RNA -proteinu interakce [46] .

Od druhé dekády 21. století existuje řada databází obsahujících výsledky experimentů ChIP-seq a jejich analýzu:

Výzkum

Eukaryota

Příkladem úspěšného použití ChIP-seq ke studiu eukaryot je studium architektury nukleozomů promotorů . Pomocí ChIP-seq bylo možné stanovit, že kvasinky mohou mít promotorové oblasti bez nukleozomů (přibližně 150 bp dlouhé), ze kterých může RNA polymeráza iniciovat transkripci [60] . Tato metoda byla také úspěšně použita pro hledání vazebných míst pro 22 transkripčních faktorů v genomu háďátka C. elegans . U 20 % všech anotovaných genů genomu háďátek byly stanoveny transkripční faktory, které je regulují [61] .

ChIP-seq je také široce používán ke studiu modifikací histonů. Je známo více než 100 modifikací histonů [62] [63] . Například je známo, že acetylace, zejména acetylace lysinu 9 histonu H3 (H3K9Ac), je obvykle spojena s otevřenými a dostupnými oblastmi chromatinu ( euchromatinu ). Současně může být methylace histonů spojena s otevřenými i hustě zabalenými oblastmi chromatinu ( heterochromatin ). Zejména mono- a trimethylace lysinu 4 histonu H3 (H3K4me1 nebo H3K4me3) je obvykle spojena s otevřeným chromatinem a každá z těchto značek představuje speciální kategorii otevřeného chromatinu: H3K4me3 označuje oblasti promotoru, H3K4me1 označuje zesilovače transkripce, H3K36me3 značky transkribované oblasti genomu. Trimethylace lysinů 9 a 27 histonu H3 (H3K9me3 a H3K27me3) je naopak spojena se zhutněním chromatinu a v důsledku toho s represí genů . H3K9me3 a H3K27me3 regulují různé typy genů: H3K27me3 převážně potlačuje transkripční faktory homeoboxu , zatímco cílové geny H3K9me3 jsou převážně transkripční faktory se zinkovým prstem [64 •• ] . Různé kombinace histonových značek mohou poskytnout ještě podrobnější informace: například přítomnost dvou značek H3K4me3 (euchromatinové značky) a H3K9me3 (heterochromatinové značky) na promotoru může být identifikátorem imprintovaných genů [65] .

Prokaryota

U bakterií se regulace genové exprese na úrovni transkripce provádí pomocí transkripčních faktorů [66] . K identifikaci vazebných míst pro takové transkripční faktory lze použít metodu ChIP-seq. Některé bakteriální transkripční faktory mají více vazebných míst v promotoru (tj. místa vzdálená od sebe méně než 100 bp) [67] . Většina špičkových vyhledávacích algoritmů identifikuje takto blízko umístěná místa jako jednu. K řešení tohoto problému se používají tzv. vrcholové dekonvoluční algoritmy, například CSDeconv [68] , GEM [69] , PICS [70] nebo dPeak [71] .

Dalším krokem po určení vazebných míst je stanovení regulovaných genů. Obvykle se asociace nalezených píku s geny provádí algoritmicky hledáním blízkých míst začátku transkripce (TSS). V případě bakterií (včetně E. coli ) však TSS nemusí být stanoven pro mnoho genů, takže místo TSS lze hledat blízká místa začátku translace, ručně zkoumat genomové prostředí píku nebo použít genovou expresi data (například porovnat expresi regulonu divokého typu) a v případě delece studovaného transkripčního faktoru na základě dat RNA-seq) [34] .

Perspektivy rozvoje

Současné pokroky v metodě ChIP-seq již umožňují analýzu vzorků obsahujících mnohem méně buněk, což značně rozšiřuje její použitelnost v oblastech, jako je embryologie a vývojová biologie, kde je získání velkých vzorků příliš nákladné nebo obtížné. Metoda má jistě potenciál detekovat mutace ve vazebných místech, které ovlivňují vazbu proteinů a regulaci genové exprese [6] .

Je však zřejmé, že problémy ChIP-seq vyžadují nová experimentální, statistická a výpočetní řešení. Je třeba snížit počet artefaktů a falešně pozitivních výsledků a také se naučit rozlišovat jednotlivé efekty studovaných jevů od kontextově závislých. Důležitý nový vývoj souvisí s objevem a analýzou distálních (umístěných ve značné vzdálenosti od genu) regulačních oblastí. Je možné, že pomocí ChIP-seq bude možné určit nepřímou vazbu DNA, například prostřednictvím dalších proteinů nebo proteinových komplexů, protože predikovaná místa mohou být funkční bez ohledu na přítomnost specifického motivu. A konečně, další informace (jako je úroveň exprese nebo data konformace chromatinu) musí být použity k rozlišení skutečné funkčnosti, protože vazba DNA nutně neznamená specifickou funkci [18] .

Slibným směrem je integrace dat získaných z velkého počtu experimentů pro řešení a analýzu složitých interakcí. K tomuto účelu se často používají různé metody strojového učení [72] [73] [74] .

Poznámky

  1. Mikkelsen TS , Ku M. , Jaffe DB , Issac B. , Lieberman E. , Giannoukos G. , Alvarez P. , Brockman W. , Kim TK , Koche RP , Lee W. , Mendenhall E. , O'Donovan A. , Presser A. , ​​Russ C. , Xie X. , Meissner A. , ​​Wernig M. , Jaenisch R. , Nusbaum C. , Lander ES , Bernstein BE Celogenomové mapy chromatinového stavu v pluripotentních buňkách a buňkách podmíněných linií.  (anglicky)  // Nature. - 2007. - Sv. 448, č.p. 7153 . - S. 553-560. - doi : 10.1038/nature06008 . — PMID 17603471 .
  2. Barski A. , Cuddapah S. , Cui K. , Roh TY , Schones DE , Wang Z. , Wei G. , Chepelev I. , Zhao K. Profilování histonových metylací s vysokým rozlišením v lidském genomu.  (anglicky)  // Cell. - 2007. - Sv. 129, č.p. 4 . - S. 823-837. - doi : 10.1016/j.cell.2007.05.009 . — PMID 17512414 .
  3. Johnson DS , Mortazavi A. , Myers RM , Wold B. Celogenomové mapování interakcí protein-DNA in vivo.  (anglicky)  // Věda (New York, NY). - 2007. - Sv. 316, č.p. 5830 . - S. 1497-1502. - doi : 10.1126/science.1141319 . — PMID 17540862 .
  4. ↑ 1 2 3 4 Park PJ ChIP-seq: výhody a výzvy vyspělé technologie.  (anglicky)  // Recenze přírody. genetika. - 2009. - Sv. 10, č. 10 . - S. 669-680. doi : 10.1038 / nrg2641 . — PMID 19736561 .
  5. ↑ 1 2 3 4 Barbara Kaboord, Maria Perr. Izolace proteinů a proteinových komplexů imunoprecipitací  //  Methods in Molecular Biology (Clifton, NJ). — 2008-01-01. — Sv. 424 . — S. 349–364 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-064-9_27 . Archivováno z originálu 23. dubna 2017.
  6. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Terrence S. Furey. ChIP-seq a dále: nové a vylepšené metodiky pro detekci a charakterizaci interakcí protein-DNA  //  Nature Reviews. genetika. — 2012-12-01. — Sv. 13 , iss. 12 . — S. 840–852 . — ISSN 1471-0064 . - doi : 10.1038/nrg3306 . Archivováno z originálu 23. dubna 2017.
  7. ↑ 1 2 3 4 5 6 7 8 9 10 Ryuichiro Nakato, Katsuhiko Shirahige. Nedávné pokroky v analýze ChIP-seq: od řízení kvality k anotaci celého genomu  //  Briefings in Bioinformatics. — 2016-03-15. —P.bbw023 . _ - ISSN 1477-4054 ​​​​1467-5463, 1477-4054 ​​​​. - doi : 10.1093/bib/bbw023 . Archivováno z originálu 21. ledna 2022.
  8. ↑ 1 2 3 4 5 6 Timothy Bailey, Pawel Krajewski, Istvan Ladunga, Celine Lefebvre, Qunhua Li. Praktické pokyny pro komplexní analýzu dat ChIP-seq  //  PLoS výpočetní biologie. — 2013-01-01. — Sv. 9 , iss. 11 . — P.e1003326 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003326 . Archivováno z originálu 4. května 2017.
  9. Anthony M. Bolger, Marc Lohse, Bjoern Usadel. Trimmomatic: flexibilní zastřihovač pro sekvenční data Illumina   // Bioinformatika . — 2014-08-01. — Sv. 30 , iss. 15 . — S. 2114–2120 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btu170 . Archivováno z originálu 24. dubna 2017.
  10. ↑ 1 2 Joel Rozowsky, Ghia Euskirchen, Raymond K Auerbach, Zhengdong D Zhang, Theodore Gibson. PeakSeq umožňuje systematické vyhodnocování experimentů ChIP-seq vzhledem ke kontrolám  //  Nature Biotechnology. — 2009-1. — Sv. 27 , iss. 1 . — S. 66–75 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1518 . Archivováno z originálu 30. března 2019.
  11. Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan. Formát Sequence Alignment/Map and SAMtools  (anglicky)  // Bioinformatics. — 2009-08-15. — Sv. 25 , iss. 16 . — S. 2078–2079 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btp352 . Archivováno z originálu 24. dubna 2017.
  12. Hashem Koohy, Thomas A. Down, Michail Spivakov, Tim Hubbard. Srovnání špičkových volajících používaných pro data DNase-Seq  // PLoS ONE. — 2014-05-08. - T. 9 , ne. 5 . — S. e96303 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0096303 .
  13. Elizabeth G. Wilbanks, Marc T. Facciotti. Vyhodnocení výkonu algoritmu v ChIP-Seq Peak Detection  // PLoS ONE. — 2010-07-08. - T. 5 , ne. 7 . — S. e11471 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0011471 .
  14. Teemu D Laajala, Sunil Raghav, Soile Tuomela, Riitta Lahesmaa, Tero Aittokallio. Praktické srovnání metod detekce vazebných míst transkripčního faktoru v experimentech ChIP-seq  // BMC Genomics. - 2009. - T. 10 , no. 1 . - S. 618 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-10-618 .
  15. ↑ 1 2 3 4 5 6 7 S. G. Landt, G. K. Marinov, A. Kundaje, P. Kheradpour, F. Pauli. Pokyny a postupy pro ChIP-seq konsorcií ENCODE a modENCODE  (anglicky)  // Genome Research. — 2012-09-01. — Sv. 22 , iss. 9 . — S. 1813–1831 . — ISSN 1088-9051 . - doi : 10.1101/gr.136184.111 .
  16. Assaf Rotem, Oren Ram, Noam Shoresh, Ralph A. Sperling, Alon Goren. Jednobuněčný ChIP-seq odhaluje buněčné subpopulace definované stavem chromatinu  // Biotechnologie přírody. — 2015-11. - T. 33 , č.p. 11 . - S. 1165-1172 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3383 . Archivováno z originálu 21. května 2016.
  17. Konsorcium projektu ENCODE. A User's Guide to the Encyclopedia of DNA Elements (ENCODE  )  // PLoS Biology / Peter B. Becker. — 2011-04-19. — Sv. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  18. 1 2 Joshua WK Ho, Eric Bishop, Peter V. Karchenko, Nicolas Nègre, Kevin P. White. ChIP-chip versus ChIP-seq: lekce pro experimentální design a analýzu dat  (anglicky)  // BMC genomika. — 28. 2. 2011. — Sv. 12 . — S. 134 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-12-134 . Archivováno z originálu 4. května 2017.
  19. Frauke Greil, Celine Moorman, Bas van Steensel. [16 DamID: Mapování interakcí protein-genom in vivo pomocí uvázané DNA adenin methyltransferázy]  //  Methods in Enzymology. - Elsevier, 2006. - Sv. 410 . — S. 342–359 . — ISBN 9780121828158 . - doi : 10.1016/s0076-6879(06)10016-6 . Archivováno 12. května 2019.
  20. Bas van Steensel, Daniel Peric-Hupkes, Maartje J. Vogel. Detekce in vivo interakcí protein–DNA pomocí DamID v savčích buňkách  (anglicky)  // Nature Protocols. — 2007-06. — Sv. 2 , iss. 6 . — S. 1467–1478 . — ISSN 1750-2799 . - doi : 10.1038/nprot.2007.148 . Archivováno 25. května 2021.
  21. Yi Eve Sun, Weihong Ge. Hodnocení Fakulty 1000 pro lidský chromatinový interaktom vázaný estrogen-receptor-alfa. . F1000 - Peer review po zveřejnění biomedicínské literatury (4. prosince 2009). Datum přístupu: 18. dubna 2020.
  22. Rongxin Fang, Miao Yu, Guoqiang Li, Sora Chee, Tristin Liu. Mapování chromatinových interakcí s dlouhým dosahem pomocí ChIP-seq s pomocí proximitní ligace  //  Cell Research. — 2016-12. — Sv. 26 , iss. 12 . — S. 1345–1348 . — ISSN 1748-7838 1001-0602, 1748-7838 . - doi : 10.1038/cr.2016.137 . Archivováno z originálu 30. března 2019.
  23. ↑ 1 2 Mazhar Adli, Bradley E Bernstein. Profilování chromatinu celého genomu z omezeného počtu buněk pomocí nano-ChIP-seq  //  Nature Protocols. — 2011-10. — Sv. 6 , iss. 10 . — S. 1656–1668 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2011.402 . Archivováno z originálu 18. dubna 2019.
  24. ↑ 1 2 Ho Sung Rhee, B. Franklin Pugh. Komplexní interakce protein-DNA v celém genomu zjištěné při rozlišení jednoho nukleotidu   // Buňka . — 2011-12. — Sv. 147 , iss. 6 . - S. 1408-1419 . - doi : 10.1016/j.cell.2011.11.013 . Archivováno z originálu 18. dubna 2019.
  25. ↑ 1 2 3 Qiye He, Jeff Johnston, Julia Zeitlinger. ChIP-nexus: nový protokol ChIP-exo pro zlepšenou detekci vazebných stop transkripčního faktoru in vivo  // Biotechnologie přírody. — 2015-4. - T. 33 , č.p. 4 . — S. 395–401 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3121 .
  26. Colin R Lickwar, Florian Mueller, Jason D Lieb. Měření dynamiky vazby protein-DNA v celém genomu pomocí kompetitivních ChIP  //  Nature Protocols. — 2013-7. — Sv. 8 , iss. 7 . - S. 1337-1353 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2013.077 . Archivováno z originálu 20. dubna 2019.
  27. Robert B. Darnell. HITS-CLIP: panoramatické pohledy na regulaci protein-RNA v živých buňkách  //  Wiley Interdisciplinary Reviews: RNA. — 2010-9. — Sv. 1 , iss. 2 . — S. 266–286 . - ISSN 1757-7012 1757-7004, 1757-7012 . - doi : 10.1002/wrna.31 . Archivováno z originálu 20. dubna 2019.
  28. László Halász, Zsolt Karányi, Beáta Boros-Oláh, Tímea Kuik-Rózsa, Éva Sipos. Imunoprecipitační mapování hybridu RNA-DNA (R-loop): analytický pracovní postup pro hodnocení inherentních zkreslení  //  Genome Research. — 2017-6. — Sv. 27 , iss. 6 . — S. 1063–1073 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.219394.116 .
  29. ↑ 1 2 3 Paul A. Ginno, Paul L. Lott, Holly C. Christensen, Ian Korf, Frédéric Chédin. Tvorba R-smyčky je charakteristickou vlastností nemethylovaných lidských CpG ostrovních promotorů  //  Molecular Cell. — 2012-3. — Sv. 45 , iss. 6 . — S. 814–825 . - doi : 10.1016/j.molcel.2012.01.017 . Archivováno z originálu 20. dubna 2019.
  30. Daniel Savic, E. Christopher Partridge, Kimberly M. Newberry, Sophia B. Smith, Sarah K. Meadows. CETCh-seq: CRISPR epitop tagging ChIP-seq proteinů vázající DNA  (anglicky)  // Genome Research. — 2015-10. — Sv. 25 , iss. 10 . - S. 1581-1589 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.193540.115 .
  31. Peter J Skene, Steven Henikoff. Efektivní cílená nukleázová strategie pro mapování vazebných míst DNA s vysokým rozlišením   // eLife . — 2017-01-16. — Sv. 6 . — P. e21856 . — ISSN 2050-084X . - doi : 10.7554/eLife.21856 . Archivováno 13. května 2020.
  32. M. Robyn Andersen, Kelsey Afdem, Marcia Gaul, Shelly Hager, Erin Sweet. Rodinná anamnéza, genetika a další přesvědčení související s rakovinou prsu  // Genetika OBM. — 27. 2. 2019. - T. 3 , ne. 3 . — S. 1–1 . — ISSN 2577-5790 . - doi : 10.21926/obm.genet.1903087 .
  33. ↑ 1 2 Přehled sekvenování čipů . epigenie.com. Získáno 22. dubna 2019. Archivováno z originálu dne 22. dubna 2019.
  34. ↑ 1 2 3 Kevin S. Myers, Dan M. Park, Nicole A. Beauchene, Patricia J. Kiley. Definování bakteriálních regulonů pomocí ChIP-seq   // Metody . — 2015-9. — Sv. 86 . — S. 80–88 . - doi : 10.1016/j.ymeth.2015.05.022 . Archivováno 2. května 2019.
  35. Michael I Love, Wolfgang Huber, Simon Anders. Moderovaný odhad násobné změny a disperze pro data RNA-seq s DESeq2  // Genome Biology. — 2014-12. - T. 15 , č.p. 12 . — ISSN 1474-760X . - doi : 10.1186/s13059-014-0550-8 .
  36. MD Robinson, DJ McCarthy, GK Smyth. edgeR: balíček Bioconductor pro diferenciální expresní analýzu dat digitální genové exprese  // Bioinformatika. — 2009-11-11. - T. 26 , č.p. 1 . — S. 139–140 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btp616 .
  37. Anais Bardet. Peak Calling  // Praktický průvodce analýzou dat ChIP-seq. — CRC Press, 2018-10-26. — S. 41–52 . — ISBN 9780429487590 .
  38. Li Chen, Chi Wang, Zhaohui S. Qin, Hao Wu. Nová statistická metoda pro kvantitativní srovnání více datových souborů ChIP-seq  // Bioinformatika. — 2015-02-13. - T. 31 , č.p. 12 . — S. 1889–1896 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btv094 .
  39. Kun Liang, Sundüz Keleş. Detekce rozdílné vazby transkripčních faktorů pomocí ChIP-seq  // Bioinformatika. — 2011-11-03. - T. 28 , č.p. 1 . — S. 121–122 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btr605 .
  40. ↑ 1 2 Yanxiao Zhang, Yu-Hsuan Lin, Timothy D. Johnson, Laura S. Rozek, Maureen A. Sartor. PePr: kanál pro stanovení priorit pro volání špiček k identifikaci konzistentních nebo rozdílných vrcholů z replikovaných dat ChIP-Seq  // Bioinformatika. — 2014-06-03. - T. 30 , č. 18 . — S. 2568–2575 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btu372 .
  41. Bradley E Bernstein, John A Stamatoyannopoulos, Joseph F Costello, Bing Ren, Aleksandar Milosavljevic. The NIH Roadmap Epigenomics Mapping Consortium  // Přírodní biotechnologie. — 2010-10. - T. 28 , č.p. 10 . — S. 1045–1048 . — ISSN 1087-0156 . - doi : 10.1038/nbt1010-1045 . Archivováno z originálu 22. května 2016.
  42. ↑ 1 2 3 Qi Zhang, Sündüz Keleş. Empirický Bayesův test pro detekci alelické nerovnováhy v ChIP-seq  // Biostatistics. — 2017-11-03. - T. 19 , č.p. 4 . — S. 546–561 . — ISSN 1468-4357 1465-4644, 1468-4357 . - doi : 10.1093/biostatistika/kxx060 .
  43. Qi Zhang. Analýza dat z experimentů ChIP-Seq  //  Výpočetní epigenetika a nemoci. — Elsevier, 2019. — S. 67–77 . — ISBN 9780128145135 . - doi : 10.1016/b978-0-12-814513-5.00005-2 . Archivováno 5. května 2019.
  44. Christopher Gregg. Hodnocení Fakulty 1000 pro Jednotný přehled alelově specifické vazby a exprese u jedinců z projektu 1000 genomů. . F1000 - Peer review po zveřejnění biomedicínské literatury (11. července 2016). Staženo: 5. května 2019.
  45. Bryce van de Geijn, Graham McVicker, Yoav Gilad, Jonathan K Pritchard. WASP: alelově specifický software pro robustní molekulární kvantitativní objev lokusu vlastností  // Nature Methods. — 2015-09-14. - T. 12 , č.p. 11 . — S. 1061–1063 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.3582 .
  46. ↑ 1 2 Susan E. Celniker, Laura AL Dillon, Mark B. Gerstein, Kristin C. Gunsalus, Steven Henikoff. Odhalení tajemství genomu   // Příroda . — 2009-06-18. — Sv. 459 , iss. 7249 . — S. 927–930 . — ISSN 1476-4687 . - doi : 10.1038/459927a . Archivováno z originálu 29. dubna 2017.
  47. Hongzhu Qu, Xiangdong Fang. Stručný přehled projektu Human Encyclopedia of DNA Elements ( ENCODE  )  // Genomics, Proteomics & Bioinformatics. — 2013-06-01. — Sv. 11 , iss. 3 . — S. 135–141 . — ISSN 2210-3244 . - doi : 10.1016/j.gpb.2013.05.001 . Archivováno z originálu 5. května 2017.
  48. Oki, S; Ohta, T. ChIP-Atlas . - 2015. - doi : 10.18908/lsdba.nbdc01558-000 .
  49. konsorcium modENCODE, Sushmita Roy, Jason Ernst, Peter V. Kharchenko, Pouya Kheradpour. Identifikace funkčních prvků a regulačních obvodů pomocí Drosophila modENCODE  (anglicky)  // Science (New York, NY). — 24. 12. 2010. — Sv. 330 , iss. 6012 . — S. 1787–1797 . — ISSN 1095-9203 . - doi : 10.1126/science.1198374 . Archivováno z originálu 5. května 2017.
  50. Jie Wang, Jiali Zhuang, Sowmya Iyer, Xin-Ying Lin, Melissa C. Greven. Factorbook.org: databáze založená na Wiki pro data o vazbě transkripčních faktorů generovaná konsorciem ENCODE  //  Nucleic Acids Research. — 2013-01-01. — Sv. 41 , iss. Problém s databází . — S. D171–176 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1221 . Archivováno z originálu 5. května 2017.
  51. Jian-Hua Yang, Jun-Hao Li, Shan Jiang, Hui Zhou, Liang-Hu Qu. ChIPBase: databáze pro dekódování transkripční regulace dlouhých nekódujících RNA a mikroRNA genů z dat ChIP-Seq  //  Nucleic Acids Research. — 2013-01-01. — Sv. 41 , iss. Problém s databází . — S. D177–187 . — ISSN 1362-4962 . doi : 10.1093 / nar/gks1060 . Archivováno z originálu 5. května 2017.
  52. Alexander Lachmann, Huilei Xu, Jayanth Krishnan, Seth I. Berger, Amin R. Mazloom. ChEA: regulace transkripčního faktoru odvozená z integračních experimentů ChIP-X v celém genomu  (anglicky)  // Bioinformatics (Oxford, Anglie). — 2010-10-01. — Sv. 26 , iss. 19 . — S. 2438–2444 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btq466 . Archivováno z originálu 5. května 2017.
  53. Jesse D. Ziebarth, Anindya Bhattacharya, Yan Cui. CTCFBSDB 2.0: databáze vazebných míst CTCF a organizace genomu  //  Nucleic Acids Research. — 2013-01-01. — Sv. 41 , iss. Problém s databází . — S. D188–194 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1165 . Archivováno z originálu 5. května 2017.
  54. Li Chen, George Wu, Hongkai Ji. hmChIP: databáze a webový server pro zkoumání veřejně dostupných dat lidských a myších ChIP-seq a ChIP-chip   // Bioinformatics (Oxford, Anglie) . — 2011-05-15. — Sv. 27 , iss. 10 . - S. 1447-1448 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btr156 . Archivováno z originálu 5. května 2017.
  55. Ivan V. Kulakovskij, Ilja E. Voroncov, Ivan S. Jevšin, Anastasija V. Soboleva, Artem S. Kasianov. HOCOMOCO: rozšíření a vylepšení kolekce modelů vazebných míst transkripčních faktorů  //  Výzkum nukleových kyselin. — 2016-01-04. — Sv. 44 , iss. D1 . — S. D116–125 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkv1249 . Archivováno z originálu 5. května 2017.
  56. Albin Sandelin, Wynand Alkema, Pär Engström, Wyeth W. Wasserman, Boris Lenhard. JASPAR: databáze s otevřeným přístupem pro vazebné profily eukaryotického transkripčního faktoru  //  Nucleic Acids Research. - 2004-01-01. — Sv. 32 , iss. Problém s databází . — P.D91–94 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkh012 . Archivováno z originálu 5. května 2017.
  57. Michail Pačkov, Piotr J. Balwierz, Phil Arnold, Jevgenij Ozonov, Erik van Nimwegen. SwissRegulon, databáze celogenomových anotací regulačních míst: poslední aktualizace  //  Nucleic Acids Research. — 2013-01-01. — Sv. 41 , iss. Problém s databází . — S. D214–220 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1145 . Archivováno z originálu 5. května 2017.
  58. Bo Qin, Meng Zhou, Ying Ge, Len Taing, Tao Liu. CistromeMap: znalostní báze a webový server pro studie ChIP-Seq a DNase-Seq u myší a lidí   // Bioinformatika (Oxford, Anglie) . — 2012-05-15. — Sv. 28 , iss. 10 . — S. 1411–1412 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/bts157 . Archivováno z originálu 5. května 2017.
  59. Qixuan Wang, Jinyan Huang, Hanfei Sun, Jing Liu, Juan Wang. CR Cistrome: databáze ChIP-Seq pro regulátory chromatinu a odkazy na modifikaci histonů u lidí a myší  //  Výzkum nukleových kyselin. — 2014-01-01. — Sv. 42 , iss. Problém s databází . — S. D450–458 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkt1151 . Archivováno z originálu 5. května 2017.
  60. Christoph D. Schmid, Philipp Bucher. Data ChIP-Seq odhalují nukleozomovou architekturu lidských promotorů  (anglicky)  // Cell. — 2007-11-30. — Sv. 131 , iss. 5 . — S. 831–832; autor odpovídá 832–833 . — ISSN 0092-8674 . - doi : 10.1016/j.cell.2007.11.017 . Archivováno z originálu 5. května 2017.
  61. Wei Niu, Zhi John Lu, Mei Zhong, Mihail Sarov, John I. Murray. Různé vazebné rysy transkripčního faktoru odhalené celogenomovým ChIP-seq v C. elegans  //  Genome Research. — 2011-02-01. — Sv. 21 , iss. 2 . — S. 245–254 . — ISSN 1549-5469 . - doi : 10.1101/gr.114587.110 . Archivováno z originálu 5. května 2017.
  62. Xiong Ji, Daniel B. Dadon, Brian J. Abraham, Tong Ihn Lee, Rudolf Jaenisch. Chromatinové proteomické profilování odhaluje nové proteiny spojené s histonem označenými genomovými oblastmi  // Proceedings of the National Academy of Sciences. — 2015-03-09. - S. 201502971 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1502971112 .
  63. Huihuang Yan, Shulan Tian, ​​​​Susan L Slager, Zhifu Sun. ChIP-seq při studiu epigenetických mechanismů onemocnění a podpoře precizní medicíny: pokroky a budoucí směry   // Epigenomika . — 2016-9. — Sv. 8 , iss. 9 . — S. 1239–1258 . - ISSN 1750-192X 1750-1911, 1750-192X . - doi : 10.2217/epi-2016-0053 .
  64. Henriette O'Geen, Lorigail Echipare, Peggy J. Farnham. Použití technologie ChIP-Seq k generování profilů modifikací histonů s vysokým rozlišením  // Metody v molekulární biologii (Clifton, NJ). - 2011. - T. 791 . — S. 265–286 . — ISSN 1064-3745 . - doi : 10.1007/978-1-61779-316-5_20 .
  65. Tarjei S. Mikkelsen, Manching Ku, David B. Jaffe, Biju Issac, Erez Lieberman. Celogenomové mapy stavu chromatinu v pluripotentních buňkách a buňkách podmíněných linií  // Příroda. - 2007-08-02. - T. 448 , č.p. 7153 . — S. 553–560 . — ISSN 0028-0836 . - doi : 10.1038/nature06008 . Archivováno z originálu 22. května 2016.
  66. Douglas F. Browning, Stephen JW Busby. Regulace iniciace bakteriální transkripce  // Nature Reviews Microbiology. - 2004-01. - T. 2 , ne. 1 . — s. 57–65 . - ISSN 1740-1534 1740-1526, 1740-1534 . - doi : 10.1038/nrmicro787 .
  67. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identifikace vazebných míst transkripčního faktoru ve vysokém rozlišení z dat PET a SET ChIP-Seq  // PLoS Computational Biology. — 2013-10-17. - T. 9 , ne. 10 . — S. e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  68. Antonio LC Gomes, Thomas Abeel, Matthew Peterson, Elham Azizi, Anna Lyubetskaya. Dekódování ChIP-seq se signálem dvojité vazby zpřesňuje vazebné píky na jednotlivé nukleotidy a předpovídá kooperativní interakci  //  Genome Research. — 2014-10. — Sv. 24 , iss. 10 . - S. 1686-1697 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.161711.113 .
  69. Yuchun Guo, Shaun Mahony, David K. Gifford. Nalezení události široké vazby genomu s vysokým rozlišením a zjišťování motivu odhaluje omezení prostorové vazby faktoru transkripce  //  Výpočtová biologie PLoS / Stein Aerts. — 2012-08-09. — Sv. 8 , iss. 8 . — P.e1002638 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1002638 .
  70. Xuekui Zhang, Gordon Robertson, Martin Krzywinski, Kaida Ning, Arnaud Droit. PICS: Probabilistic Inference pro ChIP-seq  (anglicky)  // Biometrie. — 2011-3. — Sv. 67 , iss. 1 . — S. 151–163 . - doi : 10.1111/j.1541-0420.2010.01441.x .
  71. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identifikace vazebných míst transkripčního faktoru ve vysokém rozlišení z dat PET a SET ChIP-Seq  //  Výpočtová biologie PLoS / Roderic Guigo. — 2013-10-17. — Sv. 9 , iss. 10 . — P.e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  72. Jason Ernst, Manolis Kellis. Objev a charakterizace chromatinových stavů pro systematickou anotaci lidského genomu  // Nature Biotechnology. — 25. 7. 2010. - T. 28 , č.p. 8 . — S. 817–825 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1662 .
  73. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Mapování a analýza dynamiky stavu chromatinu v devíti typech lidských buněk  // Příroda. — 23. 3. 2011. - T. 473 , č.p. 7345 . — s. 43–49 . — ISSN 1476-4687 0028-0836, 1476-4687 . - doi : 10.1038/nature09906 .
  74. Shirley Pepke, Barbara Wold, Ali Mortazavi. Výpočet pro studie ChIP-seq a RNA-seq  // Nature Methods. — 2009-11. - T. 6 , ne. 11 . — S. S22–S32 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.1371 .