Metagenomika je obor molekulární genetiky , který studuje genetický materiál získaný ze vzorků životního prostředí. Metagenomika studuje soubor genů všech mikroorganismů , které se nacházejí ve vzorku prostředí – metagenomu . Metagenomická analýza umožňuje určit druhovou diverzitu zkoumaného vzorku bez nutnosti izolace a kultivace mikroorganismů.
Hlavní výhodou použití metagenomického přístupu je zohlednění nejen kultivovaných mikroorganismů, ale i nekultivovaných. Ukázalo se, že právě takové organismy mají hlavní podíl na druhové diverzitě společenstev [1] . Metagenomika umožňuje podrobně studovat diverzitu společenstev, a tedy zjišťovat mechanismy jejich fungování, určovat metabolické vztahy [2] .
Široký rozvoj metagenomiky je způsoben rozšířením metod sekvenování nové generace . Umožňují získat sekvence téměř všech genů každého mikroorganismu ve společenství [3] . Protože cena sekvenování DNA každým dnem klesá, je taková analýza stále dostupnější.
Termín „metagenomika“ poprvé použili Joe Handelsman , John Clardy , Robert Goodman , Sean Brady a další ve své publikaci z roku 1998 [4] . Termín "metagenom" vznikl z myšlenky, že soubor genů shromážděných z prostředí může být analyzován stejným způsobem, jako jsou analyzovány celé genomy. Kevin Chen a Lyor Patcher (výzkumníci z University of California, Berkeley ) definovali metagenomiku jako „aplikaci moderních genomických technik bez nutnosti izolace a laboratorní kultivace jednotlivých druhů“ [5] .
Po dlouhou dobu se při sekvenování genomů mikroorganismů jako zdroje DNA zpravidla používaly kultury identických buněk. Nicméně rané metagenomické studie ukázaly, že v mnoha biotopech existují velké skupiny mikroorganismů, které nelze pěstovat v laboratorní kultuře, a proto nelze jejich genomy sekvenovat. Tyto rané práce studovaly sekvence 16S rRNA , které jsou poměrně krátké, často konzervované v rámci jednoho druhu a mají tendenci se lišit druh od druhu. Mnoho sekvencí 16S rRNA nalezených v různých stanovištích nebylo možné připsat žádnému z pěstovaných druhů, což ukazuje na existenci mnoha neizolovaných mikroorganismů. Tyto studie ukázaly, že pouze 1 % druhů nalezených v environmentálním vzorku je kultivováno [1] .
Molekulární výzkum v této oblasti zahájil Norman Pace a kolegové, kteří pomocí PCR studovali diverzitu sekvencí rRNA [6] . Prostřednictvím těchto studií Pace v roce 1985 prosadil myšlenku klonování DNA přímo ze vzorků životního prostředí [7] . V roce 1991 Pace a kolegové publikovali první zprávu o izolaci a klonování DNA ze vzorku životního prostředí [8] . Stávající metodika sice tehdy umožňovala pracovat pouze s velmi konzervativními, proteiny nekódujícími geny , ale umožnila potvrdit výsledky morfologických mikrobiologických studií, které ukazují na větší druhovou diverzitu mikroorganismů, než umožňovaly laboratorní kultivační metody. V roce 1995 Healy popsal metagenomickou izolaci funkčních genů z komplexní laboratorní kultury environmentálních mikroorganismů pěstovaných na suché trávě [9] . Edward DeLong , který opustil Paceovu laboratoř, položil základy pro konstrukci fylogenezí mikroorganismů z prostředí na základě 16S rRNA. Jeho vlastní skupina začala sestavovat knihovnu genetického materiálu z mořských mikroorganismů [10] .
V roce 2002 Mia Breitbard, Forest Rower a kolegové pomocí brokovnicového sekvenování vzorků životního prostředí ukázali, že 200 litrů mořské vody obsahuje více než 5 000 typů virů [11] . Další studie ukázaly, že lidské výkaly obsahují více než tisíc druhů virů a kilogram mořského sedimentu může obsahovat více než milion typů virů, včetně bakteriofágů . Téměř všechny tyto viry byly nové druhy. V roce 2004 byla DNA kompletně sekvenována z kyselých důlních vod [12] . Díky této studii bylo možné získat kompletní nebo téměř kompletní genomy bakteriálních a archaálních druhů, které dříve nebyly laboratorně kultivovány [13] .
Počátkem roku 2003 zorganizoval Craig Venter , vedoucí paralelního projektu k Human Genome Project, expedici za účelem sběru vzorků oceánské vody z celé Země ( anglicky: Global Ocean Sampling Expedition (GOS) ). Všechny vzorky byly sekvenovány brokovnicí, aby se identifikovaly genomy nových organismů. V Sargasovém moři byla identifikována DNA 2000 různých druhů, včetně 148 nových bakteriálních druhů [14] .
V roce 2005 Stefan Schuster a kolegové z University of Pennsylvania publikovali první sekvenci ze vzorku životního prostředí získaného pomocí vysoce výkonného sekvenování, přesněji pyrosekvenování [15] .
Několik projektů lidské metagenomiky je v různých fázích realizace nebo již bylo dokončeno, včetně analýzy kožní a střevní mikroflóry [16] . Získání kompletního bakteriálního obrazu těla vyžaduje obrovské úsilí, vzhledem k obrovské druhové rozmanitosti mikroorganismů.
V letech 2007-2008 byl zahájen celosvětový projekt s názvem Lidský mikrobiom . V roce 2011 byly prezentovány některé výsledky [17] [18] . Od roku 2010 je v Rusku načrtnuta rozsáhlá studie lidského metagenomu. Konsorcium předních ruských ústavů v oblasti gastroenterologie a molekulární biologie jako iniciativní projekt začalo provádět první experimenty na rozsáhlém sekvenování vzorků DNA z lidského střeva [19] .
První široce používanou metodou sekvenování náhodnou fragmentací je metoda brokovnice . Spočívá v tom, že DNA izolovaná ze vzorku je hydrolyzována na náhodné fragmenty. Ze získaných fragmentů je pak pomocí metod molekulárního klonování vytvořena knihovna klonů . Sekvence DNA jsou určeny Sangerovým sekvenováním a poté je sestaven genom [20] . Sekvenování poskytuje informace o genech, které jsou přítomny v organismech zastoupených ve vzorku. Funkční popis produktů těchto genů umožňuje určit metabolické vztahy v komunitě [21] .
Přítomnost fáze molekulárního klonování v metodě ji činí poměrně časově náročnou. Od roku 2016 se však Sangerovo sekvenování již nepoužívá ke stanovení sekvencí genomu, místo toho se používají sekvenační metody nové generace , které umožňují získat genomové sekvence organismů, které jsou ve vzorku prostředí, rychleji a bez stádia molekulární klonování. [22] [23]
Při takové analýze budou v souboru DNA ze vzorku převládat sekvence patřící k nejvíce zastoupeným organismům. Aby bylo zajištěno dostatečné pokrytí genomů nedostatečně zastoupených organismů, je nutné použít velké objemy vzorkového média. Na druhou stranu náhodná povaha metod sekvenování (náhodná fragmentace sekvence DNA ze vzorku) vede k tomu, že sekvence mnoha organismů, které by mohly zůstat nepovšimnuty při použití tradičních kultivačních metod, jsou dostupné pro analýzu, alespoň na některých malých plochách. jejich sekvence genomové DNA [12] .
Úkol určit druhové složení společenstva se řeší sekvenováním určitých genů, které by měly mít všechny organismy ve společenstvu. Některé oblasti takových sekvencí genomové DNA, jako je gen kódující 16S rRNA , se skládají z vysoce konzervovaných sekvencí a hypervariabilních oblastí [24] . Tato vlastnost umožňuje použití sekvenačních primerů , které jsou komplementární ke konzervovaným oblastem pro vytvoření sekvencí hypervariabilních oblastí. Získané sekvence umožňují přiřadit organismus ke konkrétnímu druhu [25] [26] .
Data získaná jako výsledek metagenomického experimentu obsahují obrovské množství informací a šumu, protože se jedná o fragmenty sekvencí DNA, které patří tisícům a desetitisícům různých druhů [27] . Sběr, zpracování a extrahování užitečných biologických informací ze souborů dat této velikosti jsou výpočetní problémy, které lze vyřešit pomocí bioinformatiky [28] .
První fází metagenomické analýzy je předběžné filtrování dat. Zahrnuje odstranění nadbytečných a nekvalitních sekvencí. U metagenomů odvozených od živočišných organismů je důležité odstranit sekvence eukaryotického původu [29] . Kontaminace eukaryotické genomové DNA je odstraněna pomocí algoritmů Eu-Detect [30] a DeConseq [31] .
V podstatě jsou sekvence DNA z genomických a metagenomických experimentů stejné. Metagenomické experimenty však poskytují nižší pokrytí a použití metod sekvenování nové generace pro analýzu vede k omezení délky sekvenované sekvence [28] . Úkol je komplikovaný i kvůli rozdílnému zastoupení druhů ve společenstvu. Tyto vlastnosti vedou k tomu, že sestavení oblastí genomu z dat metagenomického experimentu se stává obtížným úkolem, vyžaduje vysoký výpočetní výkon a může vést k chybným výsledkům. Lze například získat chimérické sekvence, které jsou kombinací úseků sekvencí DNA z různých organismů [32] .
Existuje několik programů, které se skládají s ohledem na čtení na konci páru, tato metoda umožňuje snížit počet chyb. Programy jako Phrap nebo Celera Assembler byly původně vytvořeny pro sestavení jednotlivých genomů, ale dávají dobré výsledky při zpracování metagenomických dat [27] . Jiné programy, jako je Velvet assembler, používají de Bruijnovy grafy ke zpracování krátkých sekvencí (čtení), které jsou výsledkem metod sekvenování nové generace. Sestavení genomů nejběžnějších druhů je usnadněno použitím referenčních genomů [32] . Po sestavení nastává následující problém: je nutné určit, ke kterému druhu výsledné sekvence patří [33] .
V metagenomické analýze se k anotaci kódujících sekvencí po sestavení používají dva hlavní přístupy [32] . První metoda je založena na hledání homologních anotovaných genů, obvykle pomocí BLAST . Tento přístup je implementován v programu MEGAN4 [34] . Druhý přístup ( ab initio ) využívá vnitřní vlastnosti sekvence k predikci kódujících oblastí , k jeho implementaci se používají trénovací sady genů příbuzných organismů [35] . Tento přístup využívají programy GeneMark [36] a GLIMMER [37] . Hlavní výhodou ab initio přístupu je, že dokáže identifikovat kódující sekvence, pro které nejsou známy žádné homology [27] .
Zatímco anotace metagenomu udává, které funkce jsou ve společenství implementovány, definice druhové skladby umožňuje určit, které organismy jsou za jejich realizaci odpovědné. Proces spojování určitých genů, a tedy funkcí, které mohou vykonávat, s určitými typy organismů se nazývá binning . Realizuje se metodou BLAST prostřednictvím hledání podobných genů, u kterých je známo, ke kterému organismu patří. Tento přístup je implementován v programu MEGAN (MEta Genome ANAlyzer) [38] . Tento program vám také umožňuje provádět funkční anotaci metagenomu. Během zpracování jsou sekvence asociovány s uzly taxonomie NCBI a funkčními klasifikačními uzly SEED nebo KEGG [39] pomocí algoritmu s nejmenším společným předkem [39] . První verze programu byla použita v roce 2005 k analýze metagenomického kontextu sekvencí DNA získaných z mamutí kosti [15] .
Jiný program, PhymmBL, používá pro tento účel interpolované Markovovy modely [27] . Metody MetaPhlAn [40] a AMPHORA [41] využívají údaje o jedinečných genetických markerech – sekvencích charakteristických pro kterýkoli klad – k určení zastoupení taxonomické skupiny v komunitě [42] . Některé metody binningu používají informace o vlastnostech vnitřní sekvence, jako jsou frekvence oligonukleotidů nebo použití kodonů .
Analýza velkého exponenciálně rostoucího počtu dostupných sekvencí DNA je náročný úkol. Analýza je navíc komplikována složitými metadaty spojenými s metagenomickými projekty. Zahrnují informace o geografii zkoumaného vzorku, environmentálních rysech, fyzikálních datech a také metodách odběru vzorků [28] . Tyto informace jsou nezbytné pro zajištění reprodukovatelnosti experimentů a pro další analýzu. Je důležité prezentovat tyto informace pomocí standardizovaných datových formátů a rozvíjet specializované databáze, jako je Genomes OnLine Database (GOLD) [43] .
Pro integraci metadat a dat o genomických sekvencích byly vyvinuty speciální služby. V roce 2007 byla vytvořena dostupná služba pro analýzu dat z metagenomických experimentů Metagenomics Rapid Annotation pomocí serveru Subsystem Technology (MG-RAST). Do roku 2012 bylo do této databáze nahráno asi 50 000 metagenomů [44] .
Srovnávací analýza metagenomů umožňuje porozumět rysům fungování mikrobiologických komunit a u symbiotických mikroorganismů stanovit jejich roli při udržování zdraví hostitele [45] . Párová a vícenásobná srovnání metagenomů se provádějí zarovnáním jejich fragmentů, porovnáním GC složení , vzorců použití oligonukleotidů a druhové diverzity. Funkční srovnání lze provést porovnáním fragmentů metagenomů s databázemi obsahujícími informace o metabolických drahách [39] . Pro určení funkce společenství nehraje důležitou roli definice druhové skladby, ale funkční popis všech genů v něm přítomných. Stejné funkce se nacházejí ve společenstvech za podobných ekologických podmínek, i když druhové složení takových společenstev se může značně lišit [46] . Proto jsou pro srovnávací analýzu velmi důležitá metadata popisující podmínky pro získání metagenomického vzorku [27] .
Hlavním cílem srovnávací metagenomiky je identifikovat skupiny mikroorganismů, které určují vlastnosti konkrétní oblasti životního prostředí. Tyto vlastnosti jsou výsledkem interakcí mezi skupinami mikroorganismů. Za tímto účelem byl vyvinut program Community-Analyzer [47] . Umožňuje porovnat taxonomické složení společenstev a identifikovat možné interakce mezi detekovanými skupinami mikroorganismů. Namísto prostého porovnávání distribuce taxonomických skupin program bere v úvahu pravděpodobnostní vzorce interakcí.
Hlavní metodou v analýze metagenomické komunity je mapování čtení do genomů známých bakterií nebo archeí anotovaných v GenBank . Abychom tedy pochopili, které mikroorganismy v daném vzorku žijí a jaké metabolické vztahy jsou mezi nimi možné, není nutné sekvenci znovu sestavovat [48] .
V mnoha bakteriálních společenstvích, přirozených i umělých (jako jsou bioreaktory ), dochází k rozdělení odpovědnosti v metabolických procesech, k tzv. syntrofii , v důsledku čehož jsou produkty metabolismu některých mikroorganismů využívány jinými mikroorganismy [49]. . Například v jednom z těchto systémů - fermentorech - existují dva syntrofní druhy ( Syntrophobacterales a Synergistia ), v důsledku jejichž společné práce se použitá surovina přeměňuje na plně metabolizovatelný odpad ( metan ) [50] . Studiem genové exprese pomocí DNA microarrays nebo proteomické analýzy mohou výzkumníci spojit části metabolické sítě a vytvořit metabolické shluky [51] .
Metagenomika umožňuje výzkumníkům přístup k funkční a metabolické rozmanitosti mikrobiálních komunit, avšak metagenomika nemůže ukázat, které z těchto metabolických procesů jsou aktivní. Extrakce a analýza metagenomické messenger RNA (metatranskriptom) poskytuje informace o regulaci profilů genové exprese komplexních komunit [46] . Kvůli technickým obtížím (například rychlá degradace molekul mediátorové RNA ) je k dnešnímu dni velmi málo studií transkriptů nekultivovaných mikrobiálních společenství. Rozvoj technologií microarray však dal impuls ke studiu metatranskriptomů a bylo možné hodnotit expresi různých genů celé komunity [52] .
Metagenomické sekvenování se používá při studiu virových společenstev. Protože viry nesdílejí společný univerzální fylogenetický marker (jako je 16S RNA pro bakterie a archaea a 18S RNA pro eukaryota), jediný způsob, jak získat přístup ke studiu genetické diverzity virové komunity v ekologickém vzorku, je prostřednictvím metagenomiky. Virové metagenomy (také nazývané viromy ) by tak měly poskytovat stále více informací o virové diverzitě a evoluci [53] .
Metagenomika má potenciál být prozkoumána v široké škále aplikací. Metagenomika může být použita k řešení praktických problémů v oblastech, jako je medicína , strojírenství, zemědělství a ekologie.
Mikrobiální komunity hrají klíčovou roli v udržování lidského zdraví , ale jejich složení a mechanismy fungování zůstávají stále nevyřešeny [54] . Metagenomické sekvenování bylo použito k charakterizaci mikrobiálních komunit u stovek jedinců. Jedná se o součást takzvaného projektu Human Microbiome Project, jehož hlavními cíli jsou: identifikovat základní soubor lidských mikrobů , pochopit, jak změny v lidské mikroflóře korelují se změnami zdraví, a vyvinout technologickou a bioinformatickou základnu pro dosažení tyto cíle [55] sekvenování genomů střevních mikroorganismů vhodných pro kultivaci v laboratorních podmínkách:
Dalším medicínským směrem je projekt MetaHit (metagenomika lidského trávicího traktu ), kterého se zúčastnilo 124 jedinců z Dánska a Španělska , mezi nimiž byli zdraví lidé, lidé s nadváhou a lidé s onemocněním trávicího traktu. Hlavním cílem studie bylo pokusit se charakterizovat fylogenetickou diverzitu gastrointestinálních bakterií. Studie ukázala, že dva bakteriální klade, Bacteroidetes a Firnicutes , zahrnují více než 90 % všech známých bakteriálních fylogenetických skupin, které dominují distálnímu střevu. Pomocí relativní frekvence genů nalezených ve střevě vědci identifikovali 1 244 metagenomických shluků, které hrají zásadní roli při udržování zdravého stavu. Byly identifikovány dvě hlavní funkce těchto shluků: udržování exprese provozních genů a exprese genů specifických pro gastrointestinální trakt. Uspořádání genů je nezbytné pro všechny bakterie a často hraje hlavní roli v metabolických drahách, jako je centrální metabolismus uhlíku , syntéza aminokyselin . Shluk specifických genů zahrnuje schopnost přilnout k hostitelským proteinům a schopnost živit se cukry . Pacienti s podrážděním tlustého střeva mají o 25 % těchto genů méně a také vykazují nižší počet bakterií než lidé, u kterých nebyly diagnostikovány žádné gastrointestinální potíže.
Ačkoli tyto studie mají potenciálně cenné lékařské aplikace, pouze 31-48,8 % sekvencí bylo porovnáno se 194 známými střevními bakteriálními genomy a pouze 7,6-21,2 % čtení bylo porovnáno se sekvencemi GenBank , což ukazuje na potřebu dalšího vývoje výzkum s cílem plně pokrýt všechny bakteriální genomy [56] .
Náklady na sekvenování lidského genomu za poslední tři roky[ co? ] se snížil téměř 100krát a nadále rychle klesá. Zlepšení technologií NGS DNA sekvenování v blízké budoucnosti povede k překonání příští cenové hranice (1000 USD za genom) a způsobí zásadní změny v mnoha oblastech biologie a lékařské genetiky , které by měly v budoucnu vést k personalizaci medicíny . Technologický boom v této oblasti molekulární genetiky naznačuje, že metagenomika postupně nahradí PCR diagnostiku. V roce 2011 byl také v Rusku vyhlášen grant na výzkum v oblasti metagenomiky [57] .
Biopaliva se získávají přeměnou biomasy , např. přeměnou celulózy získané z kukuřice a prosa na hydrolyzovaný alkohol . Tento proces se opírá o mikrobiální konsorcia k přeměně celulózy na cukry, po které následuje fermentace cukrů na etanol . Mikroorganismy také produkují různé zdroje bioenergie, včetně metanu a vodíku [58] .
Efektivní průmyslová výroba nových sloučenin z biomasy vyžaduje nové enzymy s vyšší produktivitou a nižšími výrobními náklady [59] . Metagenomické přístupy k analýze komplexních mikrobiálních společenstev umožňují cílený screening enzymů průmyslové aplikace při výrobě biopaliv, jako jsou glykosylhydrolázy [60] . Kromě toho je znalost toho, jak mikrobiální společenstva fungují, nezbytná pro řízení těchto společenstev a metagenomika je klíčovým nástrojem pro jejich pochopení. Metagenomické přístupy umožňují provádět srovnávací analýzu mezi konvergentními systémy mikroorganismů.
Prostřednictvím metagenomiky lze zlepšit strategie pro sledování účinků znečišťujících látek na ekosystém a vyvinout nové metody k vyčištění znečištěného prostředí. Hlubší pochopení toho, jak se mikrobiální komunity vypořádávají se znečišťujícími látkami, dává naději, že tento proces lze v budoucnu využít k boji proti průmyslovému znečištění [61] .
Mikrobiální společenství mohou produkovat širokou škálu biologicky aktivních látek, které jsou dále využívány jinými organismy. Mnoho dnes používaných léků se původně nacházelo v mikroorganismech. Nedávný úspěch v získávání různorodého genetického materiálu z nekultivovaných mikroorganismů vedl k objevu nových genů, enzymů a dalších aktivních sloučenin. Využití metagenomiky umožnilo rozvoj nových odvětví chemického a farmaceutického průmyslu [62] .
Jeden gram půdy použité pro pěstování rostlin obsahuje mezi 10 9 a 10 10 mikrobiálních buněk [63] . Složení mikrobiálních společenstev žijících v půdě již dlouho přitahuje pozornost vědců, ale stále zůstává špatně pochopeno, navzdory jejich ekonomickému významu. Mikrobiální společenstva plní širokou škálu ekosystémových funkcí nezbytných pro růst rostlin (například fixaci dusíku ), ochranu rostlin před chorobami, účast v koloběhu železa a dalších kovů . Metagenomika pomáhá studovat interakce mikrobů v této komunitě a také interakci mezi rostlinami a mikroby. Na základě dat získaných pomocí metagenomické analýzy je možné identifikovat vlastnosti mikroorganismů patřících k nekultivovaným taxonům, pochopit jejich roli v koloběhu látek a také jejich vztah k rostlinám. To vše je nezbytné pro zlepšení zdravotního stavu plodin [64] .
Metagenomika může poskytnout cenné informace o funkční ekologii environmentálních společenství [65] . Například metagenomické analýzy bakteriálních komunit nalezených ve výkalech lachtanů australských naznačují, že výkaly lachtanů jsou bohaté na živiny a mohou být důležitým zdrojem potravy pro pobřežní ekosystémy. Bakterie, které jsou vylučovány současně s výkaly, totiž mohou přeměnit nestravitelné sloučeniny na biologicky dostupné formy, které se mohou dále zapojit do potravního řetězce [66] .
Sekvenování DNA lze také použít k identifikaci druhů přítomných ve vodním sloupci. To může pomoci stanovit rozsah invazních druhů a ohrožených druhů a také sledovat sezónní populace [67] .
![]() | |
---|---|
V bibliografických katalozích |
Personalizovaná medicína | |
---|---|
Datové sekce Omix | |
Aplikační sekce | |
Metody | |
Související články |