Jednomolekulární sekvenování v reálném čase neboli SMRT je metoda sekvenování DNA nové generace vyvinutá společností Pacific Biosciences .
Myšlenkou této metody je určit sekvenci DNA sledováním práce jedné molekuly DNA polymerázy v reálném čase. Současně DNA polymeráza dokončuje druhý řetězec studované molekuly DNA pomocí nukleotidů značených různými fluorescenčními značkami ; registrací údajů na štítku je možné pochopit, který nukleotid DNA polymeráza právě vkládá.
Uspořádání sekvenátorů tohoto typu umožňuje na úrovni jedné molekuly sledovat syntézu komplementárního vlákna jedné molekuly jednovláknové DNA pomocí jedné molekuly DNA polymerázy. V této technologii fluorescenčně značené nukleotidy a konfokální mikroskopie s vysokým rozlišením umožňují sekvenování mnoha polymeráz v reálném čase a simultánně [1] .
ZMWMetoda je založena na použití nulového vlnovodu (ZMW) - prohlubní o průměru několika desítek nanometrů , na jehož spodku je připojena jediná molekula DNA polymerázy. Světlo je přiváděno dnem do článku ZMW. Design článku ZMW neumožňuje šíření světelné vlny a ponechává osvětlený pouze objem asi 20 zeptolitů (20 × 10 −21 litrů) u dna článku. To umožňuje pozorovat fluorescenci jediné fluorescenční značky připojené k nukleotidu aktuálně vloženému DNA polymerázou. V souladu s tím jsou na čtyři typy nukleotidů našity různé fluorescenční značky, což umožňuje jejich rozlišení. Díky tomu lze při polymeraci řetězce DNA enzymem fixovaným v ZMW získat závislost intenzity fluorescence na čase, z jehož grafu je určena sekvence DNA z píků jiného spektra [ 1] .
Při sekvenování se používají tzv. SMRT články , obsahující asi 150 000 ZMW článků, což jsou prohlubně v hliníkovém filmu nanesené na křemíkovém substrátu [2] .
NukleotidyTato metoda používá značky ( fluorofory ) připojené ke koncové fosfátové skupině nukleotidu. Taková značka má menší vliv na činnost DNA polymerázy, která je extrémně důležitá pro sekvenování v reálném čase. V procesu přidávání nukleotidu k rostoucímu řetězci DNA je značka odštěpena DNA polymerázou spolu s pyrofosfátem . Výsledkem je, že fluorofor může difundovat z pozorovaného objemu a již neovlivňovat zaznamenaný signál a nukleotid je integrován do řetězce DNA bez „příspěvků“. Měřením dlouhodobé (milisekundové) záře jedné barvy, když je značený nukleotid připojen polymerázou na pozadí rychle difundujících (mikrosekund) čtyř, je tedy možné určit sekvenci řetězce templátu DNA [1] .
Metoda sekvenování jedné molekuly v reálném čase umožňuje získat velmi dlouhá čtení (sekvence DNA) (v průměru asi 20 000 nukleotidů, až 60 000 nukleotidů), což usnadňuje další analýzu dat a předchází řadě problémů, které vznikají při práci. s krátkým čtením. Funguje bez předchozí amplifikace zkoumané DNA pomocí PCR . Tato metoda poskytuje vysokou rychlost sekvenování (teoreticky je omezena pouze rychlostí DNA polymerázy) [1] . Metoda se vyznačuje vysokou senzitivitou a specificitou: možností detekce minoritních variant ve smíšených vzorcích s frekvencí výskytu menší než 0,1 %. Umožňuje také vysoce přesné sekvenování. V tuto chvíli není příliš vysoká (83 %), ale přesnost lze zlepšit opakovaným sekvenováním molekuly DNA (> 99 % při 15 opakováních) [3] [4] .
Mezi nevýhody metody patří vysoká cena zařízení - 600 000 $ [5] . Vyznačuje se poměrně vysokou mírou chyb v důsledku průniku emisních spekter fluoroforů. Navíc náhodné připojení polymeráz ke dnu buňky ZMW vede k Poissonově distribuci počtu enzymů na buňku [1] .
Délka čtení sekvenování jedné molekuly v reálném čase je srovnatelná nebo větší než u Sangerovy metody , což umožňuje sekvenovat de novo genomy a zjednodušuje jejich sestavení [1] . Dlouhá čtení poskytují kontext potřebný ke správnému umístění repetitivních pozic v genomu. Schopnost získat dlouhé úseky DNA během sekvenování je důležitá i pro metagenomiku : je možné identifikovat organismy ve smíšených populacích – například v mikrobiomu . Protože k sestavení genomu je zapotřebí méně čtení stejných oblastí, vyžaduje dešifrování genomu touto metodou méně úsilí. Sekvenování jedné molekuly v reálném čase bylo prokázáno na de novo sekvenování genomu ve studiích analyzujících vypuknutí německé střevní infekce v roce 2011 a epidemii cholery na Haiti v roce 2010 [6] [7] .
Technologie sekvenování „třetí generace“ v kombinaci se staršími metodami může zvýšit přesnost sestavení genomu. Sekvenátory druhé generace jsou schopny číst genom v malých fragmentech o 100-700 párech bází, ale taková čtení je pak obtížné poskládat do správného pořadí. Přístroje "třetí generace" (zejména PacBio RS společnosti Pacific Biosciences) mohou generovat čtení až 23 kb, ale dělají více chyb, než zvládne normální software pro genomickou analýzu. V roce 2011 vědci z National Biodefense Analysis and Countermeasures Center ( USA ) použili krátké čtení získané během sekvenování na přístrojích Illumina a Roche 454 druhé generace k opravě chyb v dlouhých čteních generovaných sekvenátorem PacBio RS. Po testování vyvinutého algoritmu na genomech bakterie Escherichia coli a kvasinek a také na kukuřičném transkriptomu vědci zjistili, že přesnost sestavení lze zvýšit z 83 na 99,9 %. Vědci také aplikovali vyvinutou hybridní metodu úpravy na sestavení dosud nesekvenovaného genomu andulky [8] .
V roce 2012 byl k sestavení genomu kmene cholery , který způsobil epidemii Haiti v roce 2010 , použit hybridní přístup . Oblasti bakteriálního genomu, které jsou důležité pro léčbu onemocnění, byly shromážděny s přesností přesahující 99,9 % [9] .
Stejná molekula DNA může být nezávisle resekvenována pomocí kruhového templátu DNA a enzymu, který odděluje nově syntetizovaný řetězec DNA od templátu. To je důležité pro analýzu a diagnostiku různých onemocnění. Porovnáním milionů a miliard přečtení s původním textem můžete získat úplný seznam rozdílů mezi studovaným genomem a „zlatým standardem“ . Navíc, pokud je každé písmeno zdrojového textu ověřeno vícenásobným čtením, zvyšuje to statistickou významnost nalezených genetických znaků a anomálií [10] .
Vědci z Pacific Biosciences spolu se specialisty z dalších organizací použili tento přístup k doložení hypotézy aktivující tandemové duplikace FLT3 jako terapeutického cíle u akutní myeloidní leukémie [10] . Tato technologie je také vhodná pro analýzu transkriptomu a sestřih , protože jediné dlouhé čtení ze sekvenátoru může obsahovat celou mRNA . Sekvenování jedné molekuly v reálném čase umožňuje detekci jednonukleotidových polymorfismů s vysokou přesností [11] .
Kinetika polymerační reakce při sekvenování umožňuje stanovit klíčové epigenetické modifikace DNA . Při sekvenování jedné molekuly v reálném čase se přítomnost methylovaných nukleotidů posuzuje podle změny doby do dalšího záblesku, protože methylace ovlivňuje aktivitu polymerázy. Tato metoda se již používá ke stanovení methyladeninu , methylcytosinu a také 5-hydroxymethylcytosinu [12] [13] [14] . V roce 2012 skupina vědců použila tento přístup k analýze kompletního metylačního profilu 6 bakterií [15] .
Pomocí reverzní transkriptázy místo DNA polymerázy umožňuje technologie SMRT sekvenování RNA . Tímto způsobem je možné současně detekovat sekvenci, modifikace bází, permutace ovlivňující strukturu RNA. Kinetika reverzní transkripce je také citlivá na sekundární strukturu RNA, což zvyšuje pravděpodobnost dlouhých pauz nebo ukončení během reakce. Sekvenování SMRT navíc umožňuje detekovat dynamiku refoldingu RNA, například při reverzní transkripci retrovirů nebo při degradaci mRNA exozomy [16] .
Pacific Biosciences|Pacific Biosciences komercializovala sekvenování SMRT v roce 2011 [17] po vydání druhého nastavení na konci roku 2010 [18] .
V dubnu 2013 společnost vydala novou verzi sekvenceru s názvem „PacBio RS II“, která má vyšší propustnost a umožňuje delší čtení DNA [19] [20] .
Prototyp čipu SMRT obsahoval ~3000 buněk ZMW pro paralelní sekvenování DNA. V roce 2012 byly vytvořeny články SMRT, z nichž každý obsahoval asi 150 000 článků ZMW [21] .
Nová sada činidel vydaná v roce 2012 umožnila prodloužit délku čtení [22] . V současné době je průměrná délka čtení asi 40 000 bp. p., maximálně - 100 000 n. n [23] .