ChIA-PET

Analýza interakce chromatinu pomocí sekvenování párových koncových značek (ChIA-PET)  je molekulárně biologická metoda, která vám umožňuje určit interakce (prostorovou blízkost) oblastí chromatinu umístěných ve značné vzdálenosti od sebe v genomu . [1] Takové interakce jsou zajímavé pro stanovení regulačních prvků . Regulační elementy v buňkách mohou být umístěny ve značné vzdálenosti od promotoru regulovaného genu (například cis-regulační elementy , trans-regulační elementy , izolátory , enhancery). Pro pochopení mechanismů takových interakcí je nutné znát prostorové uspořádání oblastí chromatinu vůči sobě navzájem, což tato metoda umožňuje de novo určit . Získané informace jsou zase důležité pro pochopení mechanismů regulace genové exprese . [2]

ChIA-PET je založen na použití sekvenování ChIP , 3C ( Chromosome Conformation Determination ) a Paired - end tag sekvenování , k čemuž se používá vysoce výkonné sekvenování a další počítačové zpracování výsledků. [3] 

Historie

Metoda byla poprvé použita v roce 2009 [1] k určení vzdálených vazebných míst ER-alfa u lidského karcinomu prsu. Následně byla použita např. ke konstrukci interaktomu (mapy možných interakcí) zprostředkovaného CTCF v myších embryonálních kmenových buňkách [4] .

Možnosti metody

ChIA-PET kombinuje schopnosti obou metod založených na ChIP a 3C [5] a zvyšuje možnosti každé z nich. Tradiční metoda ChIP umožňuje určit interakci konkrétního proteinu s DNA a lze ji použít k hledání vazebných míst transkripčního faktoru . Pomocí ChIP-seq mohou být stanovena de novo vazebná místa zájmového proteinu v celém genomu. Pokud protein váže oblasti chromatinu, které jsou na chromozomu daleko od sebe, ale blízko v prostoru, může ChIP-seq identifikovat každou z nich, ale neindikuje jejich interakci. Ne všechny sekvence určené metodou ChIP-seq jsou však v genomu jednoznačně mapovány a ne všechny jsou funkčními vazebnými místy [6] .

Metody 3C a ChIA-PET jsou založeny na teorii proximální ligace ( proximity  ligation ), která říká, že konce oblastí chromatinu asociovaných s proteinovým komplexem, které jsou v blízkosti, budou k sobě ligovány s větší pravděpodobností než konce oblastí v roztoku nebo spojené s jiným proteinovým komplexem.

Metoda 3C umožňuje určit prostorovou strukturu chromatinu, ale neumožňuje určit interagující protein [5] . Významným problémem je potřeba přesné znalosti posloupnosti interagujících lokusů . To je nezbytné pro výběr primerů pro kvantitativní nebo semikvantitativní PCR analýzu použitou k jejich stanovení. (Je třeba poznamenat, že může existovat několik lokusů – kandidátů na interakce – určených metodou 3C). Metoda ChIA-PET umožňuje de novo stanovení prostorové struktury chromatinu spojeného se specifickým proteinem. To znamená, že na jedné straně nevyžaduje znalost sekvence DNA v oblasti interakce a na druhé straně zcela závisí na specifičnosti použitých protilátek .

Srovnávací charakteristiky

Čip ChIP seq ChIA-PET 3C
Potřebujete specifické protilátky + + + -
Je nutné znát sekvenci DNA na studovaném lokusu + - - +
Je vyžadován referenční genom - + + -
Metoda poskytuje informace o Závazné stránky O vazebných místech
de novo
O vazebných místech de novo +
konformace chromatinu
Chromatinové konformace

Popis metody

Experimentální metody

Komplexy DNA-protein jsou zesíťovány nespecificky s formaldehydem. Vzorek je vystaven ultrazvuku , zatímco molekuly DNA jsou rozdrceny na fragmenty a volně vázané nespecifické komplexy jsou zničeny. Výsledkem je, že fragmenty DNA se získají v silných komplexech s proteiny. Dále se pomocí specifických protilátek fixovaných na magnetických kuličkách vysrážejí fragmenty chromatinu asociované se zájmovým proteinem. Často jsou předměty studia známé transkripční faktory [1] . Vysrážené komplexy jsou z roztoku odstraněny magnetickými kuličkami pomocí magnetu. Izolované komplexy se rozdělí na 2 alikvoty a na konce molekul DNA se „přišijí“ oligonukleotidové semilinkery se známou sekvencí . V jednom alikvotu je poloviční linker A a ve druhém poloviční linker B. Oba poloviční linkery obsahují místo rozpoznávané restrikčním enzymem Mmel a liší se od sebe „čárovým kódem“ dvou nukleotidů : CG pro polovinu- linker A a AT pro poloviční linker B. Výsledkem je, že později, během sekvenování, mohou být linkery od sebe odlišeny „čárovým kódem“. V dalším kroku se spojí dva alikvoty a dojde k proximální ligaci, přičemž poloviční linkery jsou ligovány na sebe za vzniku linkerů plné délky. Linkery s AA (CG/CG) nebo BB (AT/AT) „čárovými kódy“ jsou považovány za pravděpodobné ligační produkty v rámci stejného komplexu, zatímco linkery s AB (CG/AT) „čárovými kódy“ jsou považovány za chimérické ligační produkty DNA asociované s různými proteinové komplexy Příprava na sekvenování zahrnuje zpracování komplexů restrikčním enzymem Mmel [8] , který štěpí DNA v určité vzdálenosti od jejího rozpoznávacího místa v polovičním linkeru. V důsledku toho se na konci tohoto stupně získají konstrukty obsahující pár "značek" ( angl.  tag ) (20 bp každý) na obou stranách úplného linkeru (38 bp). Výsledné fragmenty jsou sekvenovány na obou koncích ( PET ) .  Značky jsou pak mapovány na genom. [7] [9]

Počítačové zpracování

Počítačové zpracování výsledků sekvenování zahrnuje 6 modulů [7] [10]

Filtrování linkerů

Všechny čtené sekvence jsou rozděleny na sekvence s čitelnými "čárovými kódy" a nečitelnými "čárovými kódy". Pokud „čárový kód“ nelze přečíst, je sekvence „vyřazena“ ze zpracování. Pokud lze číst "čárový kód", pak jsou sekvence zarovnány s linkery. Všechny získané sekvence jsou rozděleny na chimérické (vzniklé ligací DNA z různých komplexů a obsahující A/B linker) a nechimérické (obsahující A/A nebo B/B linker). Je třeba poznamenat, že mezi sekvencemi obsahujícími A/A nebo B/B se mohou vyskytovat také chimérické. Dále jsou sekvence samotných linkerů „odhozeny" a sekvence „značek" (PET) jsou analyzovány. [7] [10]

Mapování PETs

Sekvence získané v předchozím kroku jsou mapovány do referenčního genomu. V první fázi jsou izolovány 100% zarovnané sekvence , které mohou být mapovány na jednom lokusu (unikátní) nebo na mnoha lokusech. Ze zbývajících sekvencí jsou izolovány ty, které obsahují 1 substituci v sekvenci ( anglicky  missmatch ) s referenčním genomem, dále jsou rozděleny na unikátní a sekvence s vícenásobným mapováním. Všechny ostatní sekvence jsou nemapované. Všechny sekvence kromě jedinečně mapovaných jsou „vyřazeny“ ze zpracování. [7] [10]

Klasifikace PETs

Existují dvě skupiny PETs: "self-ligated" ( anglicky  self-ligation PETs ) a "interligated" ( anglicky interligation  PETs ). "Self-ligated" ( anglicky  self-ligation PETs ) odpovídají koncům jednoho fragmentu ChIP-DNA, měly by být umístěny na stejném chromozomu v krátké vzdálenosti od sebe, v orientaci "head to tail". "Interligované" ( angl. interligation  PETs ) se dělí na intrachromozomální (mapované na stejném chromozomu ve velké vzdálenosti), interchromozomální (mapované na různých chromozomech) a ligované v různých orientačních značkách ( angl.  různé orientace ligační PETs ) (mapované na stejném chromozomu v krátké vzdálenosti, ale ve špatné orientaci nebo na různých vláknech DNA). Hranice oddělující "samoligované" PETs od "interligovaných" PETs je přirozeně určena délkou fragmentů DNA získaných při dané "zvukové" intenzitě. V různých experimentech to bylo 3-4,6 Kb. [7] [10]

Stanovení vazebných míst pro proteiny

Samoligační značky ( self-ligation PETs ) se používají k určení vazebných míst pro proteiny .  Postup je podobný jako u ChIP-seq .

Definice chromatinových interakcí

Při predikci tohoto typu interakce se používají "interligační" PETs . 

Vizualizace a organizace výsledků

Data z předchozích etap jsou zanesena do databází pro uložení, zpracování a případnou vizualizaci.

Nevýhody metody

  • Při této metodě není odstup signálu od šumu příliš vysoký. To může být způsobeno nespecifickými proteinovými komplexy, nedostatečnou specificitou použitých protilátek, PCR před sekvenováním a chybami v sekvenování. Všechny tyto faktory mohou způsobit chyby.
  • Druhý důležitý bod: potřeba opustit analýzu velkého množství dat. Například nejedinečné PET umístěné v repeticích, kde mohou být přítomna i funkční vazebná místa pro transkripční faktory [11]
  • Není možné určit, který z proteinů komplexu, „sedících“ na regulačním místě, je zodpovědný za tvorbu DNA smyčky. To vyžaduje další experimenty, například 3C.
  • Jsou vyžadovány specifické protilátky, navíc protein v komplexu může být stíněný a nepřístupný pro protilátky, v takovém případě nebudou vazebná místa komplexu určena.
  • Je vyžadován referenční genom.

Výhody

  • Umožňuje de novo stanovení jak chromatinových interakcí, tak vazebných míst pro proteiny.
  • Nevyžaduje znalost sekvence DNA v místě vazby proteinu.
  • Schopnost upravit selektivitu metody výběrem specifických protilátek buď pro specifický protein (například specifický transkripční faktor) nebo pro běžně používaný protein (například běžné transkripční faktory).
  • Kompatibilní se sekvenováním NGS založeným na značkách [12] .

Software použitý k analýze výsledků [13]

V experimentech ChIA-PET se používají následující počítačové programy

  • ELAND Mapuje fragmenty DNA obohacené ChIP do referenčního lidského genomu. [2]
  • Software Eisen Určuje úrovně genové exprese na základě hierarchického shlukování. [3]
  • RepeatMasker In-silico maskuje opakující se prvky. [čtyři]
  • Simulace Monte Carlo Používá se k odhadu falešně pozitivních výsledků. [čtrnáct]
  • PET-Tool Software pro zpracování a práci se sekvenčními daty Paired-End di-Tag. [5]
  • ChIA-PET Tool Software pro zpracování dat ChIA-PET. ChIA-PET Tool web ChIA-PET Tool paper Archivováno 15. ledna 2014 na Wayback Machine

Viz také

Poznámky

  1. 1 2 3 Melissa J. Fullwood, et al. An Estrogen Receptor α-bound Human Chromatin Interactome Archived 25. února 2016 na Wayback Machine . Příroda. 5. listopadu 2009; 462(7269): 58-64.
  2. Elzo de Wit a Wouter de Laat Dekáda technologií 3C: pohledy do jaderné organizace . Gene Dev. 1. ledna 2012; 26(1): 11-24.
  3. Melissa J. Fullwood a Yijun Ruan ChIP metody pro identifikaci interakcí chromatinu na dlouhé vzdálenosti Archivováno 26. května 2021 na Wayback Machine . J Cell Biochem. 1. května 2009; 107(1): 30-39.
  4. Lucy Handoko a kol. Funkční chromatinový interaktom zprostředkovaný CTCF v pluripotentních buňkách archivován 25. května 2021 na Wayback Machine . Nat Genet. 19. června 2011; 43(7): 630-638.
  5. 1 2 Dekker J Zachycení konformace chromozomu Archivováno 15. října 2017 na Wayback Machine . Věda. 15. února 2002;295(5558):1306-11.
  6. Johnson a kol., (2007). Celogenomové mapování in vivo interakcí protein-DNA. Věda. (316); 1497-502.
  7. 1 2 3 4 5 6 7 Recenze: Guoliang Li tn al. Nástroj ChIA-PET pro komplexní analýzu interakce chromatinu se sekvenováním párových koncových značek Archivováno 25. května 2021 na Wayback Machine . Genome Biol. 2010; 11(2): R22.
  8. [1] Archivováno 12. června 2015 na Wayback Machine
  9. Yufen Goh a kol. Analýza chromatinové interakce se sekvenováním párových koncových značek (ChIA-PET) pro mapování chromatinových interakcí a pochopení regulace transkripce .J Vis Exp. 2012; (62): 3770.
  10. 1 2 3 4 Stein L a kol. Prohlížeč generického genomu: stavební blok pro systémovou databázi modelových organismů Archivováno 11. května 2016 na Wayback Machine . Genome Res. 2002;12:1599-1610.
  11. Prvky Polak & Domany, Alu obsahují mnoho vazebných míst pro transkripční faktory a mohou hrát roli v regulaci vývojových procesů Archivováno 25. května 2021 na Wayback Machine . BMC Genomics. 2006, (7); 133
  12. Přispěl Fullwood a Ruan Analýza interakce celého genomu chromatinu s párovanými koncovými značkami (ChIA-PET) Archivováno 26. prosince 2010 na Wayback Machine . 2010
  13. cs:ChIA-PET
  14. Metoda Monte Carlo