Nanopore sekvenování je rodina vysoce účinných metod třetí generace DNA nebo RNA sekvenování [1] . Metoda je založena na použití proteinových, pevných nebo jiných pórů o průměru několika nanometrů , které jsou citlivé na nukleové kyseliny.
Sekvenování nanopórů se vyhýbá krokům PCR - amplifikace a chemického značení vzorku DNA nebo RNA [2] . To je významná výhoda oproti jiným metodám sekvenování, které používají alespoň jeden z těchto kroků. Mezi možnosti metody patří relativně levné genotypování , vysoká mobilita, rychlá analýza a zobrazování výsledků v reálném čase. Využití metody při rychlé detekci virových patogenů [3] , sledování bakteriální rezistence [4] , sekvenování lidského [5] [6] a rostlinného [7] genomu , haplotypizace [8] , sledování viru Ebola [9] a další pole byla popsána.
V roce 1989 byla prokázána tvorba kanálků ( nanopórů ) v umělé fosfolipidové membráně alfa-toxinem syntetizovaným Staphylococcus aureus [10] [11] . V roce 1995 byla poprvé navržena myšlenka sekvenování nanopórů - stanovení vlastností lineárního polymeru , když je protažen pórem v membráně. Při průchodu pórem s ním polymer určitým způsobem interaguje, což umožňuje určit jeho vlastnosti [12] . O rok později, v roce 1996, se objevila první práce popisující možnost využití nanopórů ( jako nanopór byl použit alfa-hemolyzin ) k charakterizaci nukleových kyselin [13] .
V letech 1999-2000 bylo prokázáno, že pomocí stafylokokového alfa-hemolyzinu jako nanopóru je možné odlišit jednovláknovou RNA od jednovláknové DNA [14] [15] .
V roce 2001 byly poprvé provedeny práce, při kterých byla pomocí nanopórů zjišťována přítomnost krátkých sekvencí DNA [16] . Teprve do roku 2009 bylo možné prokázat schopnost rozlišit všechny báze v sekvenci DNA s nanopóry, což je nezbytné pro vytvoření sekvenačních metod [17] .
V roce 2012 Oxford Nanopore Technologies předvedl první sekvenátory nanoporů: GridION a MinION [18] .
Zároveň se ukázala zásadní možnost využití této metody – genom bakteriofága phiX byl sekvenován o délce 5,4 tisíce párů bází (bp) [19] .
Nanopórový systém je reakční komora rozdělená na dvě části membránou obsahující otvor o velikosti nanometru, nanopór. Na části komory je přivedeno napětí , v důsledku čehož studované molekuly procházejí pórem ve směru elektrického pole . Při průchodu molekuly nukleové kyseliny pórem ovlivňují jednotlivé nukleotidy ten či onen měřený parametr systému, což umožňuje určit nukleotidovou sekvenci [2] . V prakticky používané verzi sekvenování nanopórů se komora naplní elektrolytickým roztokem a měří se síla proudu iontů protékajících pórem při působení pole; když nukleotidy procházejí pórem, zmenšují průřez dostupný pro ionty a proud se snižuje [20] .
V závislosti na tom, zda si sekvenované molekuly nukleové kyseliny zachovají svou chemickou integritu, existují dvě možnosti – celovláknové sekvenování a sekvenování exonukleáz [21] .
Při této metodě se řetězce nukleové kyseliny neštěpí. Přenos celých molekul DNA a RNA přes pór lze provést následujícími způsoby:
Při této metodě je řetězec nukleové kyseliny štěpen na jednotlivé nukleotidy exonukleázou umístěnou v bezprostřední blízkosti póru. Působením pole záporně nabité nukleotidy nezávisle vstupují do pórů, kde se stanovují báze [21] .
Pro sekvenování se používají proteinové nanopóry a syntetické nanopóry v pevné fázi [21] .
Alfa-hemolyzin Staphylococcus aureus je ve vodě rozpustný monomer , který spontánně tvoří heptamer v membráně . Transmembránová doména se skládá z stonku a hlavy póru. Hlavička póru obsahuje dutinu o průměru asi 4,5 nm . Na přechodu hlavně a hlavy je zúžení kanálu o šířce 1,5 nm. Pórový kmen se skládá ze 14 antiparalelních beta řetězců tvořících průchozí kanál o šířce asi 2 nm. Při neutrálním pH je mnoho aminokyselinových zbytků v póru nabito (například kladně nabitý lysinový zbytek K147 a záporně nabitý glutamátový zbytek E111). V 1 M roztoku KCl je na póru (od stonku k hlavě) udržován potenciál 120 mV, což způsobuje proud 120 pA [22] . V kmeni jsou tři rozpoznávací místa nukleotidů , což teoreticky umožňuje více než jednomu místu rozpoznat jeden nukleotid (což zvyšuje přesnost čtení) [23] .
MSPAPorin A Mycobacterium smegmatis ( Eng. Mycobacterium smegmatis porin A, MspA ) je nanopór o průměru 1,2 nm. Má strukturní vlastnosti (tvar a průměr pórů), které zlepšují poměr signálu k šumu při sekvenování DNA ve srovnání s alfa-hemolyzinem [24] . MspA má však také významnou nevýhodu: záporně nabité jádro interferuje s postupem jednovláknové DNA uvnitř póru. Proto byly pro sekvenování v původním proteinu tři negativně nabité aspartátové zbytky nahrazeny neutrálními asparaginovými zbytky [25] .
Balící protein motorové DNA bakteriofága phi29Motorický protein balení DNA bakteriofága phi29 se podílí na balení DNA do kapsidy virů a také na uvolňování DNA z kapsidy po infekci. Klíčovým rozdílem od výše uvedených proteinů je to, že mají větší průměr kanálu (od 3,6 nm do 6 nm) a jsou schopny procházet dvouvláknovou DNA. Motorický protein phi29 se díky své povaze na rozdíl od jiných pórů neintegruje do membrány ve své původní podobě, ale tento problém je řešen modifikací proteinu [26] . Jiné modifikace umožňují proteinu přeskočit jednovláknovou DNA nebo jednovláknovou RNA [27] .
Kromě proteinových nanopórů se používají i nebiologické nanopóry v pevné fázi. Pro analýzu nukleových kyselin se nanopóry používají v substrátech vyrobených z křemíku , nitridu křemíku a polyethyleniminu [27] . Póry jsou obvykle vypáleny iontovými nebo elektronovými paprsky, což umožňuje snadno měnit jejich velikost [28] . Samostatně stojí za to zdůraznit materiály, které tvoří velmi tenké „2D“ póry: grafen , disulfid molybdenu a další [27] . Grafen má také extrémně malou tloušťku, což přispívá ke zvýšení prostorového rozlišení podél DNA a zároveň pevnosti, chemické inertnosti a elektrické vodivosti . Tyto vlastnosti usnadňují použití těchto materiálů při sekvenování nanopórů [28] .
GrafenVzhledem k tenké a iontově nepropustné struktuře je grafen dobrým sekvenačním materiálem na bázi nanopórů. Bylo tedy prokázáno, že grafenové nanopóry lze použít jako elektrodu pro měření proudu protékajícího nanopóry mezi dvěma komorami obsahujícími iontové roztoky [28] .
Detekce fluorescenceV roce 2010 byla vyvinuta metoda nanosekvenování v pevné fázi založená na detekci fluorescenčního signálu . Nejprve se požadovaná DNA převede na DNA, ve které každá původní báze odpovídá krátké sekvenci. Fluorescenční sondy ( molekulární majáky ) hybridizují na tyto krátké sekvence , přičemž konec jedné sondy zháší fluorescenci fluoroforu na začátku druhé sondy. Zároveň jsou ke kódování čtyř bází potřeba pouze dva typy sond: každá báze (přesněji jí odpovídající krátká sekvence) odpovídá dvěma fluorescenčním signálům (00, 01, 10 nebo 11, kde 0 odpovídá jednomu barva a 1 k jiné). Při průchodu pórem se výsledná dvouvláknová DNA rozvine, sonda se oddělí a podle toho začne svítit fluorofor na další sondě [29] [30] .
Mezi výhody metody patří přesnost signálu – kamery registrují signál mnohem přesněji než jiné dostupné techniky. Metoda však vyžaduje předúpravu vzorku: konverzi každého nukleotidu na přibližně 12 nukleotidů (což také prodlužuje samotnou DNA) [29] .
Srovnání pevných a biologických nanopórůPevné nanopóry postrádají některé nevýhody biologických nanopórů: citlivost na pH , teplotu , koncentraci elektrolytů , mechanické namáhání atd. Navíc jsou stabilnější, déle vydrží, je mnohem snazší získat různé tvary a velikostí takových pórů a technologie výroby je podobná výrobě polovodičů , což značně usnadňuje proces získávání takových pórů a umožňuje je potenciálně kombinovat s jinými nanozařízeními. Mezi výhody biologických nanopórů patří možnost chemické nebo genetické modifikace, chemická specifita pro DNA nebo RNA a relativně nízká rychlost průchodu DNA nebo RNA pórem [28] [31] .
K získání nanopórů lze použít technologii DNA origami . Tato možnost byla poprvé prokázána v roce 2012, kdy byla pomocí DNA origami získána struktura podobná alfa hemolyzinu. Výsledná struktura se spontánně začlenila do membrán [27] .
V roce 2010 se ukázalo, že jednostěnné uhlíkové nanotrubice mohou být také zabudovány do membrán a umožňují průchod DNA [27] .
Od roku 2020 nemají nanopóry v pevné fázi chemickou specifitu proteinů, proto se aktivně studuje možnost integrace proteinových nanopórů do substrátů v pevné fázi [28] .
Dalším slibným směrem je využití nanopórů v pevné fázi se senzory (kapacitní senzory, tunelové elektronické a další detektory) [28] .
V porovnání se stávajícími sekvenačními metodami má použití této sekvenační metody výhody [2] , jako je nízká cena a snadné použití (vzhledem k absenci nutnosti přípravy vzorku a použití reagencií), vysoká citlivost (až po sekvenování). bez amplifikace DNA z krve a slin ), vysoká délka čtení (až desítky tisíc bází), vysoká mobilita, rychlá analýza a zobrazení výsledků v reálném čase [2] .
Mezi nevýhody patří takové vlastnosti, jako je nízká kvalita čtení ve srovnání s technologiemi short-read sekvenování (tato situace se však se vznikem nových algoritmů mění k lepšímu), ztráta funkčních vlastností biologických pórů v průběhu času (póry spolehlivě fungují pouze po určitou dobu). běží) a vliv faktorů prostředí na rychlost čtení sekvence a následně i na její kvalitu (motorový protein může pracovat dostatečnou rychlostí pouze v určitém rozsahu pH, přičemž ne pracuje dostatečně rychle mimo rozsah) [32] .
V únoru 2012 na konferenci AGBT na Floridě představila společnost Oxford Nanopore Technologies prototypy dvou platforem pro vysoce výkonné sekvenování dlouhých fragmentů založených na celovláknovém sekvenování nanoporů: GridION a MinION. Jako demonstrace byl sekvenován 5386 bp bakteriofágový genom PhiX. [19] Pro rok 2020 společnost vydává několik zařízení. Všechny umožňují analýzu dat v reálném čase [33]
MinionMinION je malý jednorázový buněčný sekvencer určený pro domácí použití s cílovou cenou kolem 900 $. Sekvencer má konektor USB 3.0 pro připojení k počítači. Obsahuje 512 nanopórů s podobnými vlastnostmi [2] . Buňka umožňuje sekvenovat až 30 milionů bp. DNA (přibližně za dva dny lze digitalizovat 10-20 milionů bp DNA) [34] . V roce 2019 společnost začala uvolňovat Flongle, adaptér pro MinION nebo GridION, který vám umožňuje pracovat s méně produktivními (~1 Gb, 126 nanopórů místo 512), ale mnohem levnějšími (90 $) články [35] .
GridIONGridION je zařízení určené pro sekvenování celého genomu (v podstatě MinION se zvýšenou propustností). Prototyp měl 2000 jednotlivých nanopórů, z nichž každý byl schopen přijímat čtení až do délky 5100 bp. rychlostí 150 milionů bp/h po dobu 6 hodin [2] . GridION Mk1 stojí 49 955 $ a obsahuje 5 nezávislých buněk. S jeho pomocí lze v jednom experimentu sekvenovat až 150 milionů bp. DNA [36] .
PromethionNejvýkonnější sekvencer společnosti umožňuje sekvenování několika bilionů bp v jediném experimentu. DNA. PromethION 24 obsahuje 24 buněk a je schopen digitalizovat 3,8 bilionu bp za tři dny. DNA, PromethION 48 obsahuje 48 buněk a je schopen digitalizovat 7,6 bilionu bp za tři dny. DNA. Buňky sekvenceru obsahují 3000 nanopórů [37] . Datový tok z takového počtu nanopórů nemůže být analyzován konvenčním počítačem, takže k použití tohoto sekvenátoru je nutný superpočítač (pokud však provozujete pouze jednu buňku, zvládne to běžný počítač) [37] [38] .
Další vývojSpolečnost plánuje vydat další dvě zařízení: SmidgION, sekvencer, který se připojuje k chytrému telefonu, a Plongle, sekvencer, který obsahuje 96 nezávislých, ale málo propustných buněk, a je tedy navržen pro časté sekvenování velkého množství krátké DNA. [39] .
Následné zpracování dat Oxford NanoporePo použití produktů Oxford Nanopore jsou výstupem nezpracovaná data ve formátu FAST5. Formát FAST5 používaný společností Oxford Nanopore je variantou standardu HDF5 s hierarchickou vnitřní strukturou navrženou pro ukládání metadat a událostí souvisejících se sekvencí DNA (agregovaná měření celkového proudu) předem zpracovaných pracovním zařízením. Výsledky zpracování se zobrazují v reálném čase v grafickém rozhraní MinKNOW a data se zaznamenávají ve formátu souborů FASTQ nebo .fast5 [40] . Dále musíte provést rozpoznání nukleotidů ( anglicky base calling ). Tento proces zpracuje nezpracovaná data formátu FAST5 do formátu FASTQ (v MinKNOW lze tento proces spustit během čtení čtení). Můžete také použít programy jako poreTools [41] , Guppy [42] [43] .
Dále musíte vyčistit přijaté sekvence, abyste se zbavili dat s příliš velkým šumem. K tomuto úkolu se používá např. program NanoFilt [44] [45] . Jakmile jsou data vyčištěna, mohou být výsledná data použita pro následný sběr dat a analýzu [43] .
Program ( https://github.com/skovaka/UNCALLED )
Slovníky a encyklopedie |
---|