Spárované sekvenování konce

Sekvenování párových konců  je jednou z metod sekvenování DNA nové generace, která je založena na získávání a sekvenování knihovny párových  koncových značek (PET ), ve které jsou ke každému připojeny krátké 5'- a 3'-koncové oblasti fragmentů DNA/cDNA. jiné. s přítelem.

Konstrukce knihovny párových koncových fragmentů

Existují dvě hlavní metody vytváření knihoven párových koncových fragmentů: klonováním a bez klonování [1] .

Získání klonováním

Genomová DNA prochází fragmentací (jakýmkoli způsobem: pomocí restrikčních endonukleáz, ultrazvukem, nebulizací). Adaptéry obsahující restrikční místa pro speciální endonukleázy, jako je Mmel nebo EcoP15I, jsou ligovány k fragmentům DNA . Fragmenty s adaptéry jsou ligovány do bakteriálního vektoru . Buňky E. coli jsou poté transformovány ligační směsí. Ze získaných bakteriálních kolonií jsou purifikovány samostatné plazmidy, ošetřené jednou ze speciálních restrikčních endonukleáz, jejichž místa jsou obsažena v adaptérech. Tyto endonukleázy vyříznou centrální část klonovaných fragmentů DNA a ponechávají koncové části. Po ligaci těchto úseků mezi sebou se vytvoří párové koncové fragmenty. Tyto párové koncové fragmenty jsou štěpeny standardní restrikční endonukleázou, jejíž místa jsou na okrajích klonovaných adaptérů. V závislosti na volbě následné sekvenační techniky mohou být sekvence párovaných koncových fragmentů použity jako monomery, dimery nebo konkatemery (několik fragmentů spojených dohromady).

Získání bez klonování

Fragment DNA je methylován k ochraně proti působení restrikčních endonukleáz . Konce fragmentu jsou "otupené" a fosforylují 5' konec. Tyto manipulace jsou nezbytné pro přišití adaptérů (nemethylovaných) na konce fragmentu DNA. Tyto adaptéry obsahují restrikční místo a mohou být také biotinylovány. Výsledné fragmenty DNA ohraničené adaptéry jsou cirkularizovány. Pokud adaptéry nebyly biotinylovány, lze během cyklizace přidat biotinylovaný "vnitřní" adaptér. Biotin se používá k izolaci cílových párových koncových fragmentů na sorbentu se streptavidinem. Kruhová molekula DNA je zpracována endonukleázou Mmel nebo EcoP15I, jejíž vazebná místa jsou obsažena v adaptérech. Vzniká volný PET. Před sekvenováním jsou k těmto párovaným koncovým fragmentům přišity adaptéry, které obsahují sekvence pro nasedání PCR primerů . K amplifikaci PET se používá polymerázová řetězová reakce (PCR) [2] .

Výhodou vytvoření knihovny klonováním je zachování původních fragmentů cDNA o plné délce. Klonování je však dlouhý a pracný proces. Nejoblíbenější metodou je metoda bez použití klonování. Délka sekvencí značek párových koncových fragmentů může být různá. Delší značky usnadňují čtení map . Endonukleázy použité k vytvoření fragmentů popsaných výše (Mmel nebo EcoP15I) poskytují 18/20 bp značky. respektive 25/27 bp [3] . Zvláštností těchto endonukleáz je, že zavádějí přerušení řetězce DNA pod své vazebné místo. Výsledné párové koncové fragmenty se použijí pro sekvenování nové generace ( SOLiD , Illumina, 454 Life Sciences). Delší značky lze získat jinými metodami linearizace DNA po kroku cyklizace fragmentu DNA. Hlavní výhody sekvenování se shodným koncem oproti přístupům s jedním tagem (tj. značení pouze jednoho konce fragmentu DNA) jsou snížené náklady, zvýšená specificita mapování čtení a schopnost určit strukturální rysy genomu.

Aplikace

Spárované sekvenování

Použití párovaných koncových fragmentů pro de novo genomové sekvenování má řadu výhod. Tento typ sekvenování se nazývá párové sekvenování nebo „sekvenování dvouhlavňových brokovnic“. Nejpopulárnější přístup byl navržen v roce 1995 [4] , což bylo vylepšení strategie sekvenování popsané v roce 1991 [5] .

Sekvenační technologie nové generace umožňují velmi rychle a ekonomicky číst vzorek DNA, ale délka výsledných čtení je mnohem kratší ve srovnání s těmi získanými sekvenováním pomocí Sangerovy metody .  Sestavení genomů, zejména tak komplexních, jako jsou eukaryotické genomy , z krátkých fragmentů je komplexní problém. Při velkém množství krátkých sekvencí vyvstává otázka, jak je zorientovat správným směrem a propojit, abychom získali kompletní genom. Přítomnost repetic v genomu tento úkol dále komplikuje. Řešením tohoto problému může být použití párových koncových fragmentů.

Změnou délky fragmentu DNA a tím i vzdálenosti mezi značkami lze zvolit vzdálenost, která by byla větší než opakující se část. V důsledku toho se čtené mapování stává jednoznačným. Technologie párového sekvenování umožňuje použití „nejednoznačných“ čtení (tedy takových, která mapují více než jedno místo v genomu) pro sestavení genomu. To zvyšuje efektivitu a zároveň snižuje náklady na sekvenování, protože tyto nejednoznačné sekvence nebo čtení jsou obvykle vyřazeny a nejsou brány v úvahu během sestavování.

Metoda sekvenování párových konců DNA umožňuje detekovat strukturální variace, které se vyskytly v genomu: inzerce, delece , inverze a transpozice. Při vytváření knihovny párovaných koncových fragmentů se vyberou fragmenty DNA stejné délky, například 3 kb. [6] . Po dokončení zbývajících standardních kroků (viz výše) získáme knihovnu. Výsledné čtení sekvenujeme a mapujeme. Při mapování na referenční genom by značky odvozené z jednoho fragmentu DNA měly překrývat referenční genom ve vzdálenosti asi 3 kb. (tato vzdálenost je nastavena při stavbě knihovny) od sebe navzájem a v určité orientaci. Pokud je tedy vzdálenost mezi značkami menší než 3 kb, indikuje to přítomnost delece v sekvenovaném genomu, pokud je větší, pak inzerce. Složitější příklady strukturálních variací v genomu lze získat zvážením „nekonzistentních“ míst pro mapování značek (např. vložení sekvence z jiného lokusu) [2] [6] .

Porovnání strukturních variací genomu u dvou osob (zástupce africké rasy a bělocha) ukázalo přítomnost asi 50 % celkových strukturálních variací. "Horká místa" strukturálních variací se často nacházejí na místech v genomu spojených s určitými chorobami. Strukturální variace ovlivňují organizaci genomu, neboť zajišťují pohyb exonů, „fúzi“ genů, změnu orientace genu nebo jeho amplifikaci [6] .

Metoda sekvenování párových konců DNA byla také použita k mapování genomových přestaveb rakovinných buněk [7] .

Párové sekvenování RNA

Metoda se používá k identifikaci mRNA plné délky sekvenováním 5' a 3' konců odpovídající cDNA knihovny [8] [9] . Na Obr. 3. je uvedeno obecné schéma metody. Získání knihovny párovaných koncových fragmentů pomocí PCR bez klonování cDNA umožňuje zahrnutí obtížně klonovatelné mRNA nebo mRNA s velmi nízkou koncentrací do analýzy. Dále je knihovna sekvenována pomocí moderních sekvencerů, jako je Illumina GA nebo SOLiD v4.

Sekvenování párových konců RNA se používá pro kvalitativní a kvantitativní analýzu transkriptomu : určení alternativních iniciačních startů transkripce , polyadenylačních míst a stanovení profilu genové exprese. Metodu lze také použít k identifikaci chimérických genů a případů transsplicingu , nicméně tato data vyžadují další experimentální ověření.

Výhodou sekvenování párových konců RNA ve srovnání s jinými metodami identifikace 5' a 3' konců mRNA, jako je CAGE , SAGE a SuperSAGE , je detekce obou konců mRNA současně, což poskytuje zvýšenou přesnost při mapování odpovídající mRNA na genomu. Na rozdíl od metody sekvenování RNA celého genomu , která analyzuje knihovnu náhodně získaných fragmentů RNA, sekvenování na párových koncích RNA určuje sekvence pouze konců molekul RNA, což významně snižuje náklady na kvantitativní analýzu transkriptomu, ale ne poskytují informace o vnitřní struktuře mRNA, například o poloze polymorfismů nebo struktuře exon - intron . Navíc stabilní sekundární struktury mRNA mohou komplikovat přípravu cDNA plné délky a tím i identifikaci mRNA.

ChIA-PET

Analýza interakce chromatinu metodou Paired-End Tag Sequencing (ChIA-PET) je molekulárně biologická metoda, která umožňuje určit interakci (prostorovou blízkost) oblastí chromatinu umístěných ve značné vzdálenosti od sebe od přítele v genomu. Tato metoda umožňuje de novo určit prostorové uspořádání oblastí chromatinu vůči sobě navzájem. Takové interakce jsou zajímavé pro definování regulačních prvků (např. cis-regulačních prvků, trans-regulačních prvků, izolátorů , zesilovačů , tlumičů ). Získané informace jsou zase důležité pro pochopení mechanismů regulace genové exprese .

Literatura

  1. Fullwood MJ., Wei CL, Liu ET, Ruan Y, Next-generation DNA sekvenation of paired-end tags (PET) pro transkriptomové a genomové analýzy, Genome Research, 2009, 19:521-532 [1] Archivováno 20. května 2016 na Wayback Machine
  2. 1 2 Fei Yao, Pramila N et al., Long span DNA Paired-End-Tag (DNA-PET) sekvenační strategie pro dotazování genomových strukturních mutací a rekonstrukci amplikonů řízenou fúzním bodem, PLos One, 2012, 7 (9): e46152 [2] Archivováno 1. listopadu 2014 na Wayback Machine
  3. Morgan RD et al., MmeI: minimální restrikční modifikační systém typu II, který pro ochranu hostitele modifikuje pouze jeden řetězec DNA, Nucleic Acids, 2008, 36(20):6558-6570 [3]
  4. Roach JC, Boysen C, Wang K, Hood L, Pairwise End Sequencing: Jednotný přístup ke genomickému mapování a sekvenování, Genomics, 1995, 26(2):345-53 [4] Archivováno 2. října 2016 na Wayback Machine
  5. Edwards A., Caskey T., Uzavírací strategie pro náhodné sekvenování DNA, A Companion to Methods in Enzymology, 1991, pp. 41-47 [5] Archivováno 27. června 2016 na Wayback Machine
  6. 1 2 3 Korbel JO et al., Paired-End Mapping odhaluje rozsáhlé strukturální variace v lidském genomu, Science, 2007, 318(5849): 420-6 [6] Archivováno 24. března 2017 na Wayback Machine
  7. Campbell PJ et al., Identifikace somaticky získaných přestaveb u rakoviny pomocí celogenomového masivně paralelního párového sekvenování, Nat Genet, 2008, 40(6): 722-729 [ 7] Archivováno 21. května 2016 na Wayback Machine
  8. Ng P, Wei CL, Sung WK ​​​​et al., Analýza genového identifikačního podpisu (GIS) pro charakterizaci transkriptomu a anotace genomu, Nat. Methods, 2005, 2: 105-111 [8] Archivováno 17. září 2019 na Wayback Machine
  9. Ruan X, Ruan Y, Genome wide full-length transkript analysis using 5' and 3' paired-end-tag next generation sequencing (RNA-PET), Methods Mol.Biol., 2012, 809: 535-562 [9] Archivováno 25. února 2016 na Wayback Machine