Umělý genom je směr v biologickém výzkumu spojený s genetickou modifikací existujících organismů za účelem vytvoření organismů s novými vlastnostmi. Na rozdíl od genetického inženýrství se umělý genom skládá z chemicky syntetizovaných genů.
Předpokládá se, že v budoucnu bude možné vytvořit umělé genomy, které nebudou založeny na DNA nebo s použitím jiné sady nukleotidů a jiných kódovacích principů než v přirozených genomech. Vytváření umělých genomů je tedy jednou z oblastí syntetické biologie .
Mělo by být zřejmé, že když mluvíme o syntéze genů s přirozenými genetickými kódy nebo jejich nepatrných modifikacích . Je možné syntetizovat umělý gen , který kóduje jakýkoli předem určený polypeptid , ale stále je nemožné navrhnout zásadně nový polypeptid tak, aby se alespoň sbalil do proteinové globule , nemluvě o tom, že výsledný protein začne fungovat jako enzym .
V současné době je největším úspěchem v oblasti tvorby umělého genomu syntéza chromozomu bakterie Mycoplasma mycoides , kterou provedl Craig Venter v roce 2010.
V roce 2010 zaměstnanci Craig Venter Institutepodařilo uměle syntetizovat cyklický chromozom bakterie Mycoplasma mycoides o velikosti 1 077 947 nukleotidových párů [1] . Chromozom byl implantován do buňky bakterie Mycoplasma capricolum , po jejímž rozdělení vznikla buňka zcela řízená umělým genomem.
Tento umělý genom je nyní znám pod kódovým označením JCVI-syn1.0. Téměř úplně opakuje genom jednoho z kmenů bakterie Mycoplasma mycoides , s výjimkou několika uměle zavedených genetických markerů ( anglicky watermark, watermarks ), několika nevýznamných genů odstraněných během syntézy a 19 mutací, které vznikly během sestavení DNA fragmenty . Buňky s umělým genomem fungují normálně a jsou schopné vícenásobného dělení.
Práce na umělém genomu začaly prací Fredericka Sangera a jeho spolupracovníků, kterým se v roce 1977 podařilo založit kompletní nukleotidovou sekvenci genomu bakteriofága φX174 o délce 5375 nukleotidových párů [2] . O 18 let později, v roce 1995, skupina Craiga Ventera poprvé sekvenovala genom samoreprodukujícího se organismu, bakterie Haemophilus influenzae o 1 830 137 párech [3] .
Za posledních 25 let (1985-2010) se rychlost sekvenování genomu zvýšila nejméně o 8 řádů. Exploze v počtu organismů, jejichž genomy byly přečteny, vyvolala problém pochopení biologické role každého genu v organismu. Donedávna nebylo jasné, zda genom obsahuje kompletní informace o struktuře organismu a zda by byl organismus s chemicky syntetizovaným genomem životaschopný. Další otázkou, před kterou stála molekulární biologie, bylo, zda jsou genomy bakterií nezbytné minimum a jaká je minimální sada genů, které mohou vytvořit živou buňku.
V roce 1996 Arkady Mushegyan a Evgeny Kunin ( National Center for Biotechnology Information , USA ) navrhli, že 256 ortologních genů sdílených gramnegativní bakterií Haemophilus influenzae a grampozitivní bakterií Mycoplasma genitalium je dobrou aproximací k minimálnímu souboru bakterií. buněčné geny [4] . V roce 2004 navrhla skupina výzkumníků z University of Valencia ( Španělsko ) soubor 206 genů kódujících proteiny získaných analýzou několika bakteriálních genomů [5] .
Vědci ze skupiny Craiga Ventera od roku 1995 vytvářejí organismus s minimálním uměle syntetizovaným genomem [1] . V roce 1995 sekvenovali genom Mycoplasma genitalium , původce onemocnění lidského genitourinárního systému, nejmenšího dosud známého organismu, který se dokáže sám reprodukovat. Tento mikroorganismus obsahuje 517 genů, z nichž 482 kóduje proteiny . Celkový objem genomu je 580 tisíc nukleotidových párů. V roce 1999 bylo analyzováním umístění transposonů v sekvenovaných genomech možné prokázat, že 265 až 350 genů je pro organismus životně důležitých a více než 100 genů má neznámý účel [6] . Další výzkum do roku 2005 rozšířil seznam životně důležitých genů na 382 [7] .
Později byly objeveny ještě menší prokaryotické genomy, ale všechny patří k obligátním symbiontům – organismům neschopným autonomní existence.
V roce 2003 byl sekvenován 490 885 párů genomu Nanoarchaeum equitans [8] . Bylo také zjištěno, že nesekvenovaný genom druhu Buchnera má délku asi 450 tisíc párů [9] .
Nejmenší z dosud dekódovaných bakteriálních genomů je genom intracelulárního endosymbionta bakterie Carsonella , který se skládá ze 159 662 nukleotidových párů a obsahuje pouze 182 genů kódujících protein. Tento genom byl sekvenován japonskými výzkumníky v roce 2006 [10] .
Skupina Craiga Ventera vyvinula technologii pro syntézu velkých molekul DNA založenou na chemicky syntetizovaných fragmentech o velikosti 5-7 tisíc párů, nazývaných kazety . Fragmenty byly sestaveny částečně in vitro vhodnými enzymy , částečně in vivo rekombinací v kvasinkové buňce Saccharomyces cerevisiae . Kompletní syntetický genom byl úspěšně klonován jako centromerický plazmid (YCp) v kvasinkových buňkách [11] .
První pokus o vytvoření umělého genomu, uskutečněný v roce 2008, spočíval v syntéze chromozomu Mycoplasma genitalium dlouhého 582 970 párů. Překrývající se kazety o velikosti 5–7 tisíc párů, sestavené z chemicky syntetizovaných polynukleotidů, byly postupně kombinovány pomocí enzymů do fragmentů o velikosti 24, 72 a 144 tisíc párů (1/24, 1/8 a 1/ 4 genomu). Kompletní sestavení genomu ze čtyř složek bylo provedeno rekombinací v buňce Saccharomyces cerevisiae . Sekvenování výsledného chromozomu potvrdilo přesnost syntézy. Jako prototyp byla použita bakterie M. genitalium subspecies G37 (vzorek MG408), jejíž patogenní aktivita byla blokována speciálním markerem. K identifikaci umělého genomu byly do DNA vloženy nukleotidové sekvence zvané „vodoznaky“ [ 11 ] .
Určité obtíže nastaly při přenosu syntetického chromozomu z dárcovské buňky (kvasinky) do buňky příjemce. Samostatným problémem bylo odstranění původního genomu z bakteriální buňky za účelem jeho nahrazení syntetickým.
V dalších experimentech musely být bakterie M. genitalium opuštěny jako genetický prototyp kvůli jejich extrémně nízké rychlosti růstu. Ve studiích provedených v roce 2010 byl jako prototyp použit genom Mycoplasma mycoides subsp. capricolum ( GM12 ) a jako příjemce Mycoplasma capricolum subsp . capricolum (CK) .
Za účelem vývoje technologie přenosu chromozomů z kvasinkové buňky do recipientní buňky byly vyvinuty metody pro klonování celých chromozomů ve formě kvasinkových centromerických plazmidů. Jako objekt experimentů byl použit přirozený chromozom M. mycoides . První pokusy o přenos chromozomu M. mycoides do buňky M. capricolum však skončily neúspěchem. Jak se ukázalo, problém byl v restrikčním systému bakteriálních buněk . Restrikční systémy M. mycoides a M. capricolum jsou stejné, jejich DNA je metylovaná a nejsou problémy s přímým přenosem chromozomu z jedné buňky do druhé [12] . DNA klonovaná v kvasinkách není methylována a při přenosu do M. capricolum je zničena restrikčním systémem. Aby se tomu zabránilo, byla donorová DNA methylována purifikovanou metylázou nebo extraktem z M. mycoides nebo M. capricolum , nebo byl restrikční systém buňky příjemce jednoduše zničen [13] .
Druhý pokus o syntézu bakteriálního genomu byl proveden v roce 2010. Jako prototyp byl vybrán chromozom bakterie Mycoplasma mycoides (poddruh capri GM12) o objemu 1,08 milionu nukleotidových párů . Tento umělý genom dostal kódové označení JCVI-syn1.0. Pro práci byly použity dva genomy: CP001621 [14] ( databáze GenBank ), sekvenovaný skupinou J. Glasse z Craig Venter Institute v roce 2007 [12] , a transgenní genom CP001668 [15] , sekvenovaný skupinou Carol Lartik v roce 2009 [13] . Na základě vzorku CP001621 byly syntetizovány kazety a použity pro další syntézu. Na konci sekvenování vzorku CP001668 byla provedena rekonciliace, která zjistila rozdíly v 95 fragmentech. Rozdíly shledané jako biologicky významné byly opraveny pro již syntetizované kazety. 19 rozdílů, které neovlivňují vitální aktivitu bakterie, zůstalo nezměněno. Ve čtyřech oblastech genomu, které nejsou životně důležité, se vytvoří 4 značky WM1-WM4 o délce 1246, 1081, 1109 a 1222 párů, v daném pořadí. Výsledná genová sekvence M. mycoides JCVI syn1.0 byla vložena do databáze GenBank pod kódem CP002027 [16] .