Sekvenování nové generace (NGS ) je skupina metod pro stanovení nukleotidové sekvence DNA a RNA za účelem získání formálního popisu její primární struktury . Technologie sekvenačních metod nové generace umožňuje „číst“ několik úseků genomu najednou , což je hlavní rozdíl od dřívějších sekvenačních metod. NGS se provádí opakovanými cykly prodlužování řetězce indukovaného polymerázou nebo mnohonásobnou ligací oligonukleotidů . Během NGS lze v jednom pracovním cyklu generovat až stovky megabází a gigabází nukleotidových sekvencí [1] .
První koncept sekvenování navrhl Senger v roce 1977 [2] . Tato technologie se nazývá „metoda přetržení řetězu“ . Ve stejném roce Maxam a Gilbert navrhli alternativní metodu, nazvanou " metoda chemické degradace " - je založena na štěpení fragmentu DNA značeného na jednom konci působením specifických činidel. Stanovení nukleotidové sekvence se provádí elektroforézou na polyakrylamidovém gelu s následnou autoradiografií . Potřeba hromadného, kvalitního a rychlého sekvenování podnítila četné modifikace a nejrůznější vylepšení těchto metod. V různé míře prošly změnami téměř všechny součásti tohoto procesu. Zlomovým bodem ve vývoji technologie byl vznik PCR (polovina 80. let) a automatizace hlavních fází „čtení“ DNA, což dalo vzniknout metodám sekvenování nové generace. Platformy pro metody nové generace jsou založeny na paralelizaci procesu „čtení“ DNA, a tak je možné v jednom běhu sekvenátoru určit primární struktury několika úseků genomu. Sekvencery nové generace jsou mnohem levnější a mnohem efektivnější než jejich předchůdci. K dnešnímu dni je výkon některých sekvenátorů již měřen ve stovkách miliard párů bází , což například umožňuje takovým zařízením skenovat individuální lidský genom během několika dní [3] .
Následují metody NGS v chronologickém pořadí. První metody, například založené na pyrosekvenování, daly podnět k rozvoji NGS, ale v současnosti se prakticky nepoužívají. Zbytek níže diskutovaných metod je v současné době široce používán, každá metoda má své výhody a specifika aplikace [4] [5] [6] .
metoda | zásada | maximální délka čtení, páry bází | náklady na sekvenování 1 Mbp | náklady na sekvencer | doba cyklu | počet čtení za cyklus | Výhody | omezení |
---|---|---|---|---|---|---|---|---|
454 Vědy o živé přírodě | pyrosekvenování a luciferáza | 1000 | 10 dolarů | 500 000 dolarů | 7 hodin | 1 000 000 | délka čtených genomových oblastí; Rychlost | cena; chyba |
Illumina SOLEXA | nukleotidy s fluoroforem a odstranitelnými terminátory | 300 | 0,05–0,15 USD | 1 000 000 $ (NovaSeq 6000)
100 000 $ (MiSeq) |
4 hodiny - 55 hodin | až 5 000 000 000 | efektivita, náklady | Rychlost |
Pevný | ligace oligonukleotidových sond s fluoroforem | 75 | 0,13 USD | 595 000 dolarů | až 10 dní | až 2 400 000 000 | cena | Rychlost |
Helicos | nukleotidy s fluoroforem a odstranitelnými terminátory | 2900 | 2 $ | 1 350 000 $ | 1 hodina | 35 000–75 000 | délka čtených genomových oblastí; Rychlost | nízká produktivita s požadovanou malou chybou; cena |
IonTorrent | změna pH během přidávání nukleotidů | 600 | 1 $ | 100 000 $ | 3 hodiny | až 5 000 000 | cena; Rychlost | chyba |
Pac Bio pokračování [9] | nukleotidy s fluoroforem | 20 000 | 2 $ | 600 000 dolarů | 20-30 hodin | Až 500 000 | délka čtení, přesnost | množství materiálu, cena |
MinION Mk1B [10] [11] | změna síly proudu, když obvod prochází nanopórem | délka celého NK, až 2 000 000,- | 0,47–0,90 USD | 1000 dolarů | 1 min - 2 dny | — | délka čtení, cena, absence zesílení a složité chemické transformace | chyba |
Vzhledem k rychlému rozvoji sekvenačních metod se mohou měnit parametry metod, jako je cena sekvenátorů a jejich práce, čas a délka čtených úseků [5] .
Masivně paralelní sekvenování signatur (MPSS ) je jednou z prvních technologií NGS, která byla vyvinuta v 90. letech 20. století společností Lynx Therapeutics pro sekvenování transkriptů mRNA a hodnocení genové exprese na základě jednotlivých hladin mRNA v jedné buňce [12] . Při metodě MPSS jsou transkripty zachyceny na jednotlivých mikroperličkách pomocí templátu DNA; mRNA jsou čteny hybridizací s fluorescenční značkou a poté odstraněny a tak dále několikrát za sebou. Výsledkem jsou sekvence o délce od 17 do 20 párů bází (bp). Počet transkriptů indikujících úroveň exprese je určen počtem transkriptů na milion molekul. Tato metoda nevyžaduje identifikaci genů před zahájením analýzy a její citlivost je několik molekul mRNA na buňku [13] .
První komerčně efektivní platforma NGS. Společnost 454 Life Sciences byla založena v roce 2000 Jonathanem Rothbergem (zahájena v roce 2005). Tato technologie je sekvenční syntézou emulzní PCR a pyrosekvenačních metod [14] .
Amplifikace DNA probíhá v kapkách vody v olejové emulzi. Každá kapka vody obsahuje jednořetězcový templát DNA navázaný na primer na perličce. Dále je každá kulička umístěna na čip, což je optické vlákno . Jsou zde umístěny i enzymy nezbytné pro sekvenování: DNA polymeráza, luciferáza , ATP-sulfuryláza . V poslední sestavě probíhá sekvenační reakce v článcích o objemu 3,4·10 6 pl, na jejichž stěnách je speciální kovový povlak, který tlumí hluk [15] .
Autory metody jsou britští chemici Shankar Balasubramanian a David Klenerman. Tato metoda sekvenování využívá jednotlivé molekuly DNA připojené k mikrokuličkám. V roce 2006 byl spuštěn Solexa Genome Analyzer 1G, první platforma generující krátké segmenty genomu. Od doby, kdy byl analyzátor genomu získán společností Illumina, používá analyzátor genomu opticky čisté buňky s 8 jednotlivými povrchy (někdy méně: 4, 2 nebo dokonce 1), na které se vážou oligonukleotidy . Na rozdíl od pyrosekvenování dochází k prodlužování sekvence postupně, což umožňuje odstranit velké DNA čipy najednou pomocí kamery [16] .
Platforma SOLiD (Supported Oligonukleotid Ligation and Detection System 2.0) vyvinutá společností Applied Biosystems je sekvenační technologie pro krátké čtení založená na ligaci . Metoda byla navržena v laboratoři George Church a publikována v roce 2005. Podstatou metody je stanovení nukleotidové sekvence malých fragmentů (25-75 bp) genomové DNA; adaptéry jsou ligovány na oba konce prefragmentované DNA , které jsou nezbytné pro emulzní PCR na magnetických kuličkách a následné sekvenování na průtokové cele [17] .
Technologie NGS bez elektroforetické separace, umožňující čtení milionů krátkých imobilizovaných sekvencí DNA . Hlavní myšlenkou metody je generování velkého množství unikátních „polonií“ (molekulárních kolonií generovaných polymerázou), které jsou sekvenovány v náhodném pořadí. Sekvenování polonií se provádí pro knihovnu párových koncových značek (párované koncové značky): každá molekula DNA má délku 135 párů bází (bp), obsahuje dvě značky dlouhé 17–18 bp, oddělené a ohraničené společnou sekvencí [ 18] [19] .
První metoda sekvenování jedné molekuly vyvinutá společností HeliScope (Helicos BioSciences) má propustnost asi 1 Gb/den. Princip činnosti: po klonální amplifikaci vzorku dochází k fragmentaci DNA, následně k polyadenylaci na 3'-konci, následuje sekvenování střídající se s promýváním vzorků fluorescenčně značenými nukleotidy [20] . V roce 2012 byl na společnost prohlášen konkurz a zanikla [21] , ale licenci na technologii získala společnost SeqLL založená v roce 2013 [22] .
Při této metodě jsou do sekvenovaného fragmentu DNA postupně zavedeny 4 adaptéry, díky kterým se při další replikaci Phi29 pomocí DNA polymerázy ( replikace rolling circle replication ) složí syntetizovaná molekula DNA do nanokuliček DNA. Poté jsou nanobalonky uloženy na substrát, který má četná pole ~300 nm pro vazbu DNA, uspořádaná v mřížce. Organizace těchto polí umožňuje umístit na substrát více DNA a zvýšit hustotu informace v obraze ve srovnání s náhodnou aplikací DNA na substrát (například jako při sekvenování polony) [23] .
Ligace ukotvení kombinační sondy je kombinovaná sekvenační metoda, která využívá kombinaci hybridizace poolu sond a ligace. Každá sonda se skládá z devíti bází, které jsou degenerované (to znamená, že to může být kterákoli ze čtyř) ve všech pozicích kromě jedné, které se mají číst. Pozice zájmu je označena jedním ze čtyř barviv odpovídajících každé dusíkaté bázi. Kotevní sekvence komplementární k adaptéru a sondám se hybridizuje na templát. Sondy hybridizované proti jednomu z konců kotevní sekvence jsou pak ligovány. Po hybridizaci a ligaci jsou přebytečné sondy vymyty a je pořízen snímek. Poté se celý komplex kotva-sonda smyje a proces se opakuje s použitím sond pro další pozice. Po přečtení 5 sousedících bází se proces opakuje s použitím kotev s pěti dalšími degenerovanými bázemi, což umožňuje sekvenování až 10 bází na každé straně adaptéru. Celkem se sekvenuje 70 čtení bází z původního fragmentu, 35 bází na každém konci adaptéru. Kvůli vzdálenosti mezi adaptéry nejsou tyto sekvence 35 bází souvislé, protože obsahují mezeru o dvou bázích a mezeru o pěti bázích [24] .
Metoda je založena na vztahu mezi chemickou a digitální informací; tato technologie se také nazývá pH -indukované sekvenování. Proces je založen na detekci protonů, které se získávají při syntéze řetězce DNA jako vedlejší produkt. V důsledku toho se změní pH roztoku, což lze detekovat [25] .
Platforma Ion Torrent se od ostatních sekvenačních technologií liší tím, že nepoužívá modifikované nukleotidy ani optické techniky. Metoda Ion Torrent vám umožňuje studovat transkriptomy , malé RNA a provádět ChIP-seq . Navíc může být použit ke studiu genomů mikrobiálních společenstev [25] .
Nástup metody sekvenování jedné molekuly v reálném čase (SMRT) umožnil v reálném čase pozorovat práci DNA polymerázy, která vytváří syntetizovaný řetězec. Podstatou metody je stanovení nukleotidové sekvence fragmentů genomové DNA se specifickými adaptéry DNA ligovanými na jejich konce, které jsou nezbytné pro následné sekvenování. Význam sekvenování SMRT je podobný jako u dříve popsaných metod NGS – DNA polymeráza dokončuje druhý řetězec studované molekuly DNA pomocí nukleotidů značených různými fluorescenčními značkami, které jsou zaznamenány pomocí konfokální mikroskopie s vysokým rozlišením [26] .
Metoda je založena na měření proudu iontů jediným nanopórem v nevodivé membráně . Jak nukleotidy procházejí tímto pórem, proud klesá. Doba, po kterou se mění iontový proud, a velikost tohoto poklesu závisí na tom, který nukleotid se právě nachází uvnitř póru [27] .
Rychlost a nízká cena metod NGS, které byly dříve nedostupné, vyvolaly boom v odvětví genomického výzkumu. Díky NGS bylo možné provádět dříve technicky nedostupné experimenty [28] [29] . Aplikace NGS není omezena na stanovení genomových sekvencí, ale rozšiřuje se na studium transkriptomu, struktury chromatinu a dalších oblastí molekulární a buněčné biologie. Níže jsou uvedeny hlavní příklady oblastí aplikace metod NGS [30] .
Zlevnění a rozšíření NGS umožnilo určit vazebná místa protein-DNA ( ChIP-seq ), interagující oblasti DNA ( určení konformace chromozomů ) a otevřené oblasti chromatinu v celém genomu a také realizovat projekty ENCODE a modENCODE [31] .
ChiP-seq se používá k mapování vazebných míst DNA-vazebných proteinů, čehož bylo dříve dosaženo imunoprecipitací chromatinu a hybridizací bez sekvenování microarray [32] .
Zpřístupnily se genomy živých systémů různé složitosti, od mikroorganismů po člověka, včetně genomu cytogeneticky normálních buněk myeloidní leukémie . Zvětšení délky čtení urychlilo sestavení celých genomů [33] .
Sekvenování určitých oblastí v genomech se používá k identifikaci polymorfismů (zejména jednonukleotidových polymorfismů ) a mutací v genech podílejících se na rozvoji nádorů a dalších onemocnění. Příkladem takové rozsáhlé práce je projekt 1000 genomů [34] .
NGS je široce používán při studiích diverzity mikroorganismů v různých vzorcích (například mikrobiální populace v oceánu a půdě, identifikace nových virů v transplantovatelných orgánech, charakterizace mikroflóry charakteristické pro gastrointestinální trakt atd.) [35] .
Na základě NGS byl vyvinut nový přístup sekvenování RNA (RNA-seq) pro mapování a počítání transkriptů v biologických vzorcích. Tato metoda má výhody oproti dříve používané metodě DNA microarray . Například pole DNA závisí na překrývání genomových sekvencí, zatímco RNA-seq umožňuje charakterizaci transkripce bez předchozí znalosti místa začátku transkripce [36] .
V blízké budoucnosti budou sekvenační technologie rychlejší a levnější, což umožní jejich použití k identifikaci cílů pro lékovou terapii u pacientů s rakovinou. Již v roce 2013 trvalo sekvenační analýze nové generace méně než 100 dní od biopsie po dokončení NGS. Sekvenování celého genomu (WGS) a sekvenování celého transkriptomu (WTS) trvá stejně dlouho [37] .