16S rRNA je jedním ze tří hlavních typů rRNA , které tvoří páteř prokaryotických ribozomů . Čísla v názvu rRNA se rovnají hodnotě sedimentační konstanty . V souladu s tím je pro danou molekulu tato hodnota rovna 16S ( Swedbergovy jednotky ). Celkem byly v prokaryotických mikroorganismech nalezeny tři typy rRNA: 23S a 5S ve velké podjednotce ribozomu (50S), 16S v malé podjednotce ribozomu (30S). Podobně konstanty dalších dvou molekul rRNA jsou 23 a 5 S, v daném pořadí. Eukaryotickým analogem 16S rRNA je 18S rRNA [1] .
K dnešnímu dni byly nukleotidové sekvence v 16S rRNA a 18S rRNA studovány pro více než 400 druhů z různých říší divoké zvěře . Sekvence genu 16S rRNA se používá především při studiu fylogenetiky bakterií a archeí . Od roku 2010 byl zahájen projekt Earth Microbiome , který spojuje výzkum na toto téma. Také genová sekvence 16S rRNA se používá pro lékařský výzkum patogenních bakterií.
16S rRNA byla poprvé izolována Eisenbergem a Litaurem v roce 1959 během experimentů k izolaci a studiu fyzikálních vlastností RNA Escherichia coli . Na základě srovnání viskozit roztoků RNA a DNA navrhli, že RNA je jednovláknová molekula. Při separaci molekul RNA izolovaných z bakteriálních buněk byly nalezeny dvě frakce RNA, které se liší v hodnotách sedimentačních koeficientů. Pro lehčí frakci byl koeficient roven 16S a pro těžší frakci 25S [2] .
Později, v 60. letech, A. Belozersky a A. Spirin zjistili, že rRNA tvoří 80–90 % veškeré buněčné RNA. Poprvé také popsali rozdíl ve struktuře a složení rRNA u prokaryotických a eukaryotických organismů. Objev ribozomů a rRNA prokaryotického typu v mitochondriích a chloroplastech se stal jedním z důkazů teorie symbiogeneze [3] [4] [5] .
Primární struktura 16S rRNA je reprezentována jednořetězcovou sekvencí sestávající z 1600 ribonukleotidů . V celé sekvenci jsou konzervované pro mnoho druhů a hypervariabilní oblasti jsou rovnoměrně distribuovány. Oblasti se nazývají konzervativní, jejichž sekvence se v uvažovaných organismech mírně liší nebo se neliší vůbec. Hypervariabilní jsou ty oblasti, jejichž sekvence se u vzdálených organismů značně liší, ale u blízce příbuzných mají určité procento podobnosti [6] [7] .
Gen 16S rRNA obsahuje devět hypervariabilních oblastí, označených V1-V9. Každá oblast má délku 30 až 100 párů bází. Tato místa se podílejí na tvorbě sekundární struktury malé podjednotky ribozomu . Mezi hypervariabilními oblastmi obsahuje gen 16S rRNA vysoce konzervované sekvence. Stupeň konzervatismu hypervariabilních oblastí není stejný - ukázalo se, že sekvence více konzervovaných oblastí jsou podobné u organismů na úrovni taxonů vysokých úrovní a méně konzervativních - na úrovni nízkých taxonomických úrovní , jako jsou rody a druhy [8] [9] .
V sekundární struktuře 16S rRNA lze rozlišit 4 dobře definované domény (stejně jako proteinová doména je doména RNA stabilní, samosestavující se struktura molekuly): 5'-doména (zbytky 1-556), centrální (zbytky 564-912) a dva '-konce (velká doména 926-1391 a malá doména 1392-1542). Různé domény jsou od sebe odděleny šroubovicemi, které končí vlásenkami RNA . Také sekundární struktura 16S rRNA obsahuje 5'- a 3'- nepárové báze, které tvoří smyčky. Předpokládá se, že tyto báze se mohou podílet na tvorbě terciární struktury 16S rRNA, spojující se pomocí vodíkových vazeb , nikoli podle kanonické Watson-Crickovy vazby bází [11] .
Pro 16S rRNA byly popsány následující funkce:
Všechny tři prokaryotické geny rRNA (16S, 23S a 5S ) jsou v ko-transkribovaném operonu a jsou odděleny geny tRNA a sekvencemi spaceru . Během zpracování primárního transkriptu , prováděného endonukleázami , jsou sekvence spaceru odstraněny a meziprodukty se objevují jako produkt a nakonec zralá RNA [13] .
16S rRNA je součástí malé podjednotky ribozomu a hraje důležitou roli při dekódování mRNA . Prekurzorem rRNA je 17S rRNA, která je uvolňována z primárního transkriptu nukleázou RNázy III . Další zpracování 5' konce provádějí RNázy E a G. Jak se zpracovává 3' konec, zůstává v tuto chvíli nejasné [13] .
Sekvence 16S rRNA je reprezentována devíti hypervariabilními oblastmi a konzervovanými sekvencemi, které je oddělují. Vzhledem k těmto rysům primární struktury bylo navrženo použít pro fylogenetické studie gen 16S rRNA . Prvním vědcem, který použil 16S rRNA k navázání rodinných vztahů mezi skupinami bakterií, byl Carl Woese . Navrhl, že gen 16S rRNA by mohl být použit jako spolehlivé molekulární hodiny , protože bylo zjištěno, že 16S rRNA z evolučně vzdálených bakteriálních druhů mají podobné části sekvence a funkce [14] [1] [15] .
Hypervariabilní oblasti tedy umožňují odlišit různé druhy od sebe a přítomnost vysoce konzervovaných oblastí umožňuje vytvoření univerzálních primerů , které lze použít ke studiu bakterií a archeí , bez ohledu na jejich taxonomickou příslušnost. První pár univerzálních primerů, který se stal široce používaným, vyvinul Weisburg et al [14] .
Je třeba také poznamenat, že vybraná oblast nasedání primeru je tak konzervativní, že lze použít univerzální primery k amplifikaci 16S rRNA mitochondrií a chloroplastů , potomků alfa-proteobakterií a sinic [16 ] .
Sekvenační metody s univerzálními primery se v lékařské mikrobiologii používají jako rychlá a levná alternativa k morfologické metodě identifikace bakterií, která vyžaduje velké množství manipulací, často včetně nutnosti dlouhodobé kultivace potenciálního patogena v laboratorních podmínkách. Navíc sekvenování poskytuje spolehlivější výsledky [17] . V tomto odvětví se používají určité hypervariabilní oblasti: například oblast V3 je nejlepší pro identifikaci rodů patogenů a oblast V6 pro identifikaci druhů [18] .
V roce 2010 byl zahájen projekt Earth Microbiome , který si stanovil ambiciózní úkol vytvořit globální katalog biodiverzity nekultivovaných mikroorganismů na naší planetě, tedy těch, které se obtížně pěstují a udržují v laboratoři. . Tato rozsáhlá studie plánuje analyzovat mikrobiální komunity z více než 200 000 environmentálních vzorků poskytnutých laboratořemi po celém světě. Sekvence genů 16S rRNA se používají k určení taxonomické příslušnosti mikroorganismů ve vzorcích. Z odebraných vzorků se izoluje DNA a poté se provede PCR s primery pro 16S rRNA. Amplikony získané během PCR jsou sekvenovány . V tomto druhu výzkumu lze použít sekvenační technologie Illumina , Ion Torrent a další platformy . Úplné sekvence hypervariabilních oblastí zájmu lze zpravidla získat po jediné sekvenační události [19] . Projekt dosud analyzoval více než 30 000 vzorků [20] .
V takových studiích je věnována zvláštní pozornost výběru primerů a fragmentu, který má být amplifikován . Hlavními kritérii je úplné pokrytí studovaných organismů (v tomto případě archaea a bakterie) a fylogenetické rozlišení sekvence, tedy jak podrobně je možné ze sekvence určit taxonomickou příslušnost organismu [21] .
The Earth Microbiome Project využívá hypervariabilní oblasti V4 a V4-V5 ke klasifikaci mikroorganismů, protože tyto oblasti jsou považovány za optimální pro klasifikaci mikrobiálních společenstev. PCR primery pro tyto fragmenty jsou vylepšením oproti dříve používaným primerům 515F, 907R a 806R. Vylepšení staré verze primerů bylo vyžadováno, aby bylo možné získat delší amplikony, což umožnilo lépe identifikovat organismy ze skupin Crenarachaeota/Thaumarchaeota, jejichž přesnou klasifikaci nebylo možné dříve určit [22] [23]. .
Oblast, která má být zesílena | Název primeru | Sekvence primeru (5'-3') |
---|---|---|
V4 | 515F | GTG YCA GCM GCC GCG GTA A |
V4 [24] | 806R | GGA CTA CHV GGG TWT CTA AT |
V4-V5 | 515F | GTG YCA GCM GCC GCG GTA A |
V4-V5 | 926R | CCG YCA ATT YMT TTR AGT TT |
V4-V5 [23] | 907R | CCG TCA ATT CCT TTG AGT TT |
S nahromaděním velkého množství dat bylo zjištěno, že některé typy bakterií byly nesprávně klasifikovány podle morfologických znaků. Na základě sekvenování 16S rRNA byly izolovány nové druhy, včetně těch, které nebylo možné kultivovat v laboratoři [25] [26] a dokonce i rody [27] . S příchodem sekvenování třetí generace bylo v mnoha laboratořích možné současně identifikovat tisíce sekvencí 16S rRNA během několika hodin, což umožňuje metagenomické studie , jako jsou studie střevní mikroflóry [28] .
Spolu s mnoha výhodami, které má popsaný způsob navazování rodinných vazeb mezi skupinami organismů (univerzálnost použití a relativní rychlost provedení), existují i nevýhody. Zejména hypervariabilní oblasti málo rozlišují mezi blízce příbuznými druhy . Například sekvence genu 16S rRNA u zástupců čeledí Enterobacteriaceae , Clostridiaceae a Peptostreptococcaceae jsou z 99 % podobné. To znamená, že hypervariabilní oblast V4 se může lišit pouze o několik nukleotidů , což znemožňuje spolehlivě rozlišit mezi taxony bakterií nízkého postavení . Pokud se studium bakteriální taxonomie omezí na analýzu hypervariabilních oblastí 16S rRNA, může dojít k chybnému spojení blízce příbuzných skupin do jednoho taxonu a podcenění diverzity studované skupiny bakterií [29] [30] .
Kromě toho může bakteriální genom obsahovat několik genů 16S rRNA, jejichž hypervariabilní oblasti V1, V2 a V6 představují největší vnitrodruhovou diverzitu. Ačkoli to není nejpřesnější metoda pro klasifikaci bakteriálních druhů, analýza hypervariabilních oblastí zůstává jednou z nejpoužívanějších metod použitelných pro studium bakteriálních společenstev [31] .
Ve světle předpokladu, že evoluce je řízena vertikálním přenosem genetického materiálu z předků na potomky, byly geny 16S rRNA dlouho považovány za druhově specifické, a proto velmi přesné markery pro určování vztahu mezi skupinami prokaryot . Stále větší počet pozorování však naznačuje možnost horizontálního přenosu těchto genů. Kromě pozorování horizontálního přenosu genů v přírodě byly předloženy experimentální důkazy těchto událostí. Studie používala mutantní kmen Escherichia coli postrádající vlastní gen 16S rRNA. Sestavení funkčního ribozomu však bylo pozorováno pomocí 16S rRNA vypůjčené z nepříbuzné bakterie E. coli [32] [15] . Podobná interoperabilita byla také pozorována u Thermus thermophilus . Navíc byl u T. thermophilus pozorován úplný i částečný přenos genů . Částečný přenos byl vyjádřen ve spontánní tvorbě zjevně náhodné chimérické sekvence mezi genem hostitelské bakterie a cizím genem [33] .
Gen 16S rRNA se tedy mohl vyvinout několika způsoby, včetně vertikálního a horizontálního přenosu genu. Četnost poslední varianty může být výrazně vyšší, než se dříve předpokládalo.
Kompletní sekvence genů 16S rRNA, stejně jako mnoho dalších, jsou sestaveny z přečtení - určitých nukleotidových sekvencí získaných po sekvenování . Sekvenování se provádí na platformě Illumina (délka čtení dosahuje 250 párů bází); pomocí technologie sekvenování Sanger (délka čtení - až 1000 párů bází); pomocí iontového polovodičového sekvenování (délka čtení - až 200 párů bází). Dále jsou čtení porovnána s referenční sekvencí genu 16S rRNA, takže kompletní sekvence genu je sestavena z mnoha čtení.
Genové sekvence 16S rRNA byly určeny pro typové kmeny bakterií a archaea a shromážděny v otevřených databázích, jako je NCBI . Kvalita sekvenovaných sekvencí obsažených v takových databázích však často není kontrolována. V důsledku toho jsou široce používány sekundární databáze obsahující pouze sekvence genu 16S rRNA [34] . Níže jsou uvedeny nejčastěji používané databáze.
Databáze EzBioCloud, dříve známá jako EzTaxon, se skládá z kompletního hierarchického taxonomického systému obsahujícího k únoru 2020 65 342 bakteriálních a archaálních sekvencí 16S rRNA. Databáze EzBioCloud je systematicky spravována a pravidelně aktualizována. Webová stránka databáze navíc poskytuje bioinformatické nástroje , jako je ANI kalkulátor pro zjištění procentuální podobnosti mezi dvěma sekvencemi prokaryotických genomů, nástroj pro párové zarovnání pro dvě sekvence a mnoho dalších [35] .
RDP je spravovaná databáze poskytující informace o sekvenci rRNA a související programy a služby. Navrhovaný obsah zahrnuje zarovnání rRNA seskupených podle fylogeneze, fylogenetické stromy odvozené od zarovnání , sekundární struktury rRNA a různé programy pro vizualizaci a analýzu informací pro výzkum genů rRNA. Většina softwarových balíků je k dispozici ke stažení a místnímu použití [36] .
SILVA je databáze obsahující manuálně ověřený a pravidelně aktualizovaný soubor zarovnání sekvencí rRNA malých podjednotek (16S/18S) a velkých podjednotek ribozomů (23S/28S) týkajících se všech tří životních domén . Na základě databáze byla také vytvořena služba pro návrh primerů a konstrukci fylogenetických zarovnání [37] .