Analýza interakce chromatinu pomocí sekvenování párových koncových značek (ChIA-PET) je molekulárně biologická metoda, která vám umožňuje určit interakce (prostorovou blízkost) oblastí chromatinu umístěných ve značné vzdálenosti od sebe v genomu . [1] Takové interakce jsou zajímavé pro stanovení regulačních prvků . Regulační elementy v buňkách mohou být umístěny ve značné vzdálenosti od promotoru regulovaného genu (například cis-regulační elementy , trans-regulační elementy , izolátory , enhancery). Pro pochopení mechanismů takových interakcí je nutné znát prostorové uspořádání oblastí chromatinu vůči sobě navzájem, což tato metoda umožňuje de novo určit . Získané informace jsou zase důležité pro pochopení mechanismů regulace genové exprese . [2]
ChIA-PET je založen na použití sekvenování ChIP , 3C ( Chromosome Conformation Determination ) a Paired - end tag sekvenování , k čemuž se používá vysoce výkonné sekvenování a další počítačové zpracování výsledků. [3]
Metoda byla poprvé použita v roce 2009 [1] k určení vzdálených vazebných míst ER-alfa u lidského karcinomu prsu. Následně byla použita např. ke konstrukci interaktomu (mapy možných interakcí) zprostředkovaného CTCF v myších embryonálních kmenových buňkách [4] .
ChIA-PET kombinuje schopnosti obou metod založených na ChIP a 3C [5] a zvyšuje možnosti každé z nich. Tradiční metoda ChIP umožňuje určit interakci konkrétního proteinu s DNA a lze ji použít k hledání vazebných míst transkripčního faktoru . Pomocí ChIP-seq mohou být stanovena de novo vazebná místa zájmového proteinu v celém genomu. Pokud protein váže oblasti chromatinu, které jsou na chromozomu daleko od sebe, ale blízko v prostoru, může ChIP-seq identifikovat každou z nich, ale neindikuje jejich interakci. Ne všechny sekvence určené metodou ChIP-seq jsou však v genomu jednoznačně mapovány a ne všechny jsou funkčními vazebnými místy [6] .
Metody 3C a ChIA-PET jsou založeny na teorii proximální ligace ( proximity ligation ), která říká, že konce oblastí chromatinu asociovaných s proteinovým komplexem, které jsou v blízkosti, budou k sobě ligovány s větší pravděpodobností než konce oblastí v roztoku nebo spojené s jiným proteinovým komplexem.
Metoda 3C umožňuje určit prostorovou strukturu chromatinu, ale neumožňuje určit interagující protein [5] . Významným problémem je potřeba přesné znalosti posloupnosti interagujících lokusů . To je nezbytné pro výběr primerů pro kvantitativní nebo semikvantitativní PCR analýzu použitou k jejich stanovení. (Je třeba poznamenat, že může existovat několik lokusů – kandidátů na interakce – určených metodou 3C). Metoda ChIA-PET umožňuje de novo stanovení prostorové struktury chromatinu spojeného se specifickým proteinem. To znamená, že na jedné straně nevyžaduje znalost sekvence DNA v oblasti interakce a na druhé straně zcela závisí na specifičnosti použitých protilátek .
Čip | ChIP seq | ChIA-PET | 3C | |
---|---|---|---|---|
Potřebujete specifické protilátky | + | + | + | - |
Je nutné znát sekvenci DNA na studovaném lokusu | + | - | - | + |
Je vyžadován referenční genom | - | + | + | - |
Metoda poskytuje informace o | Závazné stránky | O vazebných místech de novo |
O vazebných místech de novo + konformace chromatinu |
Chromatinové konformace |
Komplexy DNA-protein jsou zesíťovány nespecificky s formaldehydem. Vzorek je vystaven ultrazvuku , zatímco molekuly DNA jsou rozdrceny na fragmenty a volně vázané nespecifické komplexy jsou zničeny. Výsledkem je, že fragmenty DNA se získají v silných komplexech s proteiny. Dále se pomocí specifických protilátek fixovaných na magnetických kuličkách vysrážejí fragmenty chromatinu asociované se zájmovým proteinem. Často jsou předměty studia známé transkripční faktory [1] . Vysrážené komplexy jsou z roztoku odstraněny magnetickými kuličkami pomocí magnetu. Izolované komplexy se rozdělí na 2 alikvoty a na konce molekul DNA se „přišijí“ oligonukleotidové semilinkery se známou sekvencí . V jednom alikvotu je poloviční linker A a ve druhém poloviční linker B. Oba poloviční linkery obsahují místo rozpoznávané restrikčním enzymem Mmel a liší se od sebe „čárovým kódem“ dvou nukleotidů : CG pro polovinu- linker A a AT pro poloviční linker B. Výsledkem je, že později, během sekvenování, mohou být linkery od sebe odlišeny „čárovým kódem“. V dalším kroku se spojí dva alikvoty a dojde k proximální ligaci, přičemž poloviční linkery jsou ligovány na sebe za vzniku linkerů plné délky. Linkery s AA (CG/CG) nebo BB (AT/AT) „čárovými kódy“ jsou považovány za pravděpodobné ligační produkty v rámci stejného komplexu, zatímco linkery s AB (CG/AT) „čárovými kódy“ jsou považovány za chimérické ligační produkty DNA asociované s různými proteinové komplexy Příprava na sekvenování zahrnuje zpracování komplexů restrikčním enzymem Mmel [8] , který štěpí DNA v určité vzdálenosti od jejího rozpoznávacího místa v polovičním linkeru. V důsledku toho se na konci tohoto stupně získají konstrukty obsahující pár "značek" ( angl. tag ) (20 bp každý) na obou stranách úplného linkeru (38 bp). Výsledné fragmenty jsou sekvenovány na obou koncích ( PET ) . Značky jsou pak mapovány na genom. [7] [9]
Počítačové zpracování výsledků sekvenování zahrnuje 6 modulů [7] [10]
Všechny čtené sekvence jsou rozděleny na sekvence s čitelnými "čárovými kódy" a nečitelnými "čárovými kódy". Pokud „čárový kód“ nelze přečíst, je sekvence „vyřazena“ ze zpracování. Pokud lze číst "čárový kód", pak jsou sekvence zarovnány s linkery. Všechny získané sekvence jsou rozděleny na chimérické (vzniklé ligací DNA z různých komplexů a obsahující A/B linker) a nechimérické (obsahující A/A nebo B/B linker). Je třeba poznamenat, že mezi sekvencemi obsahujícími A/A nebo B/B se mohou vyskytovat také chimérické. Dále jsou sekvence samotných linkerů „odhozeny" a sekvence „značek" (PET) jsou analyzovány. [7] [10]
Mapování PETsSekvence získané v předchozím kroku jsou mapovány do referenčního genomu. V první fázi jsou izolovány 100% zarovnané sekvence , které mohou být mapovány na jednom lokusu (unikátní) nebo na mnoha lokusech. Ze zbývajících sekvencí jsou izolovány ty, které obsahují 1 substituci v sekvenci ( anglicky missmatch ) s referenčním genomem, dále jsou rozděleny na unikátní a sekvence s vícenásobným mapováním. Všechny ostatní sekvence jsou nemapované. Všechny sekvence kromě jedinečně mapovaných jsou „vyřazeny“ ze zpracování. [7] [10]
Klasifikace PETsExistují dvě skupiny PETs: "self-ligated" ( anglicky self-ligation PETs ) a "interligated" ( anglicky interligation PETs ). "Self-ligated" ( anglicky self-ligation PETs ) odpovídají koncům jednoho fragmentu ChIP-DNA, měly by být umístěny na stejném chromozomu v krátké vzdálenosti od sebe, v orientaci "head to tail". "Interligované" ( angl. interligation PETs ) se dělí na intrachromozomální (mapované na stejném chromozomu ve velké vzdálenosti), interchromozomální (mapované na různých chromozomech) a ligované v různých orientačních značkách ( angl. různé orientace ligační PETs ) (mapované na stejném chromozomu v krátké vzdálenosti, ale ve špatné orientaci nebo na různých vláknech DNA). Hranice oddělující "samoligované" PETs od "interligovaných" PETs je přirozeně určena délkou fragmentů DNA získaných při dané "zvukové" intenzitě. V různých experimentech to bylo 3-4,6 Kb. [7] [10]
Stanovení vazebných míst pro proteinySamoligační značky ( self-ligation PETs ) se používají k určení vazebných míst pro proteiny . Postup je podobný jako u ChIP-seq .
Definice chromatinových interakcíPři predikci tohoto typu interakce se používají "interligační" PETs .
Vizualizace a organizace výsledkůData z předchozích etap jsou zanesena do databází pro uložení, zpracování a případnou vizualizaci.
V experimentech ChIA-PET se používají následující počítačové programy