Cancer Genome Atlas ( TCGA ) neboli ARG je projekt, jehož cílem je systematizovat data o genetických mutacích , které vedou k rakovině [1] . Systematizace se provádí pomocí sekvenačních a bioinformatických metod . Tento projekt je výsledkem spolupráce mezi National Cancer Institute a Human Genome Research Institute , USA [2] .
Aby bylo možné plně prozkoumat každou variantu rakoviny, odpovídající vzorek prošel rozsáhlou studií s využitím sekvenačních a bioinformatických metod : kvantitativní analýza genové exprese a počtu variací genových kopií, genotypizace jednonukleotidových polymorfismů , analýza metylačních vzorců DNA v celém genomu , sekvenování exonů . Získaná data jsou ve veřejné doméně, každý výzkumník se s nimi může seznámit a využít je ve své práci.
Projekt ARG ukázal, že aktivní a rozsáhlá spolupráce výzkumníků z různých institucí může být plodná a data získaná jako výsledek práce mohou využít vědci z celého světa.
AWG začal v roce 2005 jako tříletý pilotní projekt [3] . Na financování startovací verze AWG bylo přiděleno téměř 100 milionů dolarů. V počáteční fázi vědci charakterizují multiformní glioblastom , rakovinu plic a rakovinu vaječníků , protože tato onemocnění jsou každoročně příčinou mnoha úmrtí v USA [4] .
První fáze práce byla úspěšně dokončena, takže cílem bylo do roku 2014 charakterizovat 20-25 typů rakoviny. Systematizaci genetických mutací zajišťovaly dva typy center: fázi sekvenování zajišťovala centra pro popis genomů a bioinformatickou analýzu dat centra pro analýzu genomických dat [5] .
V září 2013 projekt ARG shromáždil dostatek vzorků nádorové tkáně k charakterizaci více než 30 typů rakoviny. Do roku 2017 bylo podrobně studováno 33 typů zhoubných nádorů, včetně 10 vzácných typů [6] .
AWG končí v roce 2017, ale všechna data, která AWG obdrží, zůstanou ve veřejné doméně. Příklad úspěchu tohoto projektu dokazuje proveditelnost společné práce několika organizací při práci v oblasti genomiky nádorů a pomůže v budoucím výzkumu v této oblasti [2] .
Pacientům s diagnózou rakoviny je s jejich svolením odebrán kousek rakovinné a normální tkáně (obvykle krev ). Tkáně a tekutiny používané pro analýzu se nazývají vzorek nebo biomateriál.
Vzorky tkáně pacientů, které mají být použity pro genomický výzkum , musí projít přísnou kontrolou kvality, aby jejich genetický materiál ( DNA a RNA ) mohl být použit při komplexní genetické analýze pomocí sekvenačních technologií nové generace. Testování, zpracování a přípravu tkání pro další analýzu, stejně jako přímou izolaci DNA a RNA, provádějí laboratoře pro analýzu vzorků v ARG (Biospecimen Core Resources) [7] . Všechny informace o pacientech jsou důvěrné. Vzorky podléhají přísným kritériím kvality, například obsah rakovinných buněk v biomateriálu musí být minimálně 60 %. Dříve se toto kritérium rovnalo 80 %, ale se zavedením sekvenování nové generace bylo sníženo .
Pro každý typ rakoviny jsou analyzovány nádorové a normální tkáně od stovek pacientů. Pro statistickou významnost stanovení kompletního genomického profilu odpovídajícího onemocnění je potřeba velký počet vzorků. Genomické profilování je nezbytné k identifikaci změn, které vedou k rozvoji nádoru. Tato práce zahrnuje centra pro popis genomů [8] , centra pro vysoce výkonné sekvenování [9] a také centra pro analýzu genomických dat [10] . První z nich analyzuje mnoho genetických změn (jako je počet variací genových kopií), které se potenciálně podílejí na vývoji nádoru, stejně jako změny v hladinách genové exprese v rakovinných tkáních ve srovnání s normálními tělesnými buňkami, které fungují jako kontroly. Vysoce výkonná sekvenační centra pak určují změny v DNA spojené s konkrétním typem rakoviny. Toho je dosaženo pomocí sekvenování exomu , 10 % tkání podstoupí sekvenování celého genomu, aby se identifikovaly změny, které neovlivňují exony , ale potenciálně ovlivňují rakovinnou transformaci. Výsledkem je obrovské množství informací, které zpracovávají centra pro analýzu genomických dat. Stejná centra poskytují různé nástroje pro vizualizaci a analýzu dat v DGA, aby podpořily jejich širší využití mezi vědci po celém světě.
Veškeré informace získané během práce výzkumníků byly uchovávány v TCGA Data Coordinating Center [11] a vloženy do otevřených databází. Výzkumníci vyhledávali, stahovali a analyzovali data ARG pomocí příslušného portálu (TCGA Data Portal) [12] , který obsahoval genomové profily příslušných typů rakoviny. Z důvodu ukončení smlouvy AWG s Koordinačním centrem (DCC) byl 15. července 2016 datový portál AWG uzavřen. Nyní jsou data o projektu AWG volně dostupná na portálu Genomics Data Commons [13] .
V roce 2008 oznámil tým výzkumníků ARG některé výsledky ve své studii mozkového nádoru, glioblastomu ; objevili nové genetické mutace v DNA, které mohou být použity pro diagnostiku a léčbu [17] . Vědci tohoto výsledku dosáhli díky rozsáhlé studii genomů izolovaných z nádorových tkání 206 pacientů s diagnostikovaným glioblastomem. Data zahrnují informace o bodových mutacích , chromozomálních přestavbách (jako jsou variace počtu kopií genu), hladinách genové exprese a epigenomice . Pracovníci ARG sekvenovali 601 genů ze vzorků nádorové tkáně a porovnali tyto výsledky s kontrolními vzorky. Byli schopni identifikovat významné a statisticky významné mutace, které odlišují buňky glioblastomu od normálních buněk a které nebyly dříve charakterizovány. Vědcům se podařilo identifikovat čtyři podtypy glioblastomu, které se od sebe liší svými genomickými charakteristikami, mírou přežití, věkem pacientů a reakcí na léčbu [18] . Tyto podtypy byly pojmenovány proneurální, nervový, klasický a mezenchymální glioblastom. Pořadí pacientů je důležité pro rozvoj individuální terapie, která může vést ke zvýšení efektivity lékařské intervence.
Rakovina vaječníků je pátou nejčastější příčinou úmrtí žen ve Spojených státech. Kvůli nedostatku účinné léčby mají ženy s touto diagnózou spíše negativní prognózu: pouze 31 % všech pacientek žije déle než pět let od okamžiku, kdy byla nemoc diagnostikována. Vzhledem k mimořádné relevanci výzkumu v oblasti tohoto typu rakoviny se vědci ARG rozhodli charakterizovat jej jako jeden z prvních a navrhnout potenciální nové cíle pro terapii. Výzkumníci byli schopni najít stovky genů v nádorových tkáních, které byly odstraněny nebo duplikovány . Mezi těmito geny je 68 duplikovaných, pro jejichž produkty jsou již známy odpovídající inhibitory . Tento objev poskytuje výchozí bod při hledání nových léků pro léčbu rakoviny vaječníků. Vědci zjistili, že v závislosti na tom, které geny jsou nadměrně exprimovány v nádorových buňkách vaječníků, je možné předpovědět očekávanou délku života pacientky. Bylo identifikováno 108 a 85 genů, které jsou spojeny s dobrým a špatným přežitím. Lidé, kteří nadměrně exprimují odpovídajících 108 genů, žijí o 23 % déle než ti, kteří nadměrně exprimují ostatních 85 genů. Glioblastom má ve srovnání s rakovinou vaječníků zásadně odlišný genomový vzorec: je více charakterizován genetickými mutacemi, obvykle ve stejných genech, a variace v počtu kopií genů je na rozdíl od rakoviny vaječníků mnohem méně zastoupena. To naznačuje, že různé typy rakoviny se od sebe liší právě povahou změn v DNA. Pokud je tato teorie správná, pak lze naplánovat individuální genomové profily pro každou rakovinu [19] .
National Cancer Institute (NCI) a Human Genome Research Institute (NHGRI) financovaly testovací verzi projektu ARG po dobu tří let , přičemž každý poskytl 50 milionů dolarů. Poté NCI poskytovala 25 milionů dolarů ročně na podporu druhé fáze AWG po dobu pěti let a NHGRI posílala 25 milionů dolarů ročně po dobu dvou let. V roce 2009 byl podepsán zákon (American Recovery and Reinvestment Act, ARRA), který ARG poskytl dodatečné finanční prostředky ve výši 175 milionů $ [20] . Po podpisu tohoto dokumentu začala druhá fáze existence AWG. Představenstvo NCI poskytlo dalších 25 milionů $ v prvním roce po ARRA na sekvenční analýzu a dalších 25 milionů $ ve druhém roce druhé fáze ARG. Celkem bylo přiděleno 150 milionů dolarů na sekvenování vzorků a 70 milionů dolarů na odběr vzorků, kontrolu kvality a izolaci DNA a RNA.
ARG zahrnuje vzorky od více než 11 000 pacientů pro 33 typů rakoviny [21] a je zdaleka největší sbírkou nádorů. Tyto vzorky jsou analyzovány na klíčové genomické a molekulární vlastnosti. Sběr vzorků ARG skončil v roce 2013 a od dubna 2017 vědci ARG konečně dokončili sekvenování exomu pro všechny typy nádorů a sekvenování celého genomu pro více než 1000 vzorků rakovinné tkáně. Více než 2700 vědeckých článků odkazuje na práci ARG, což dokazuje obrovskou roli tohoto projektu v rozvoji myšlenek o rakovině [22] . Všechna data ARG jsou dostupná a lze je bez omezení použít pro publikace [23] .
druh rakoviny | Počet analyzovaných vzorků [21] | Identifikované mutace [24] |
---|---|---|
Akutní myeloidní leukémie | 200 | V 99,5 % případů je identifikována alespoň jedna nesynonymní mutace v jednom z následujících genů: NPM1 (27 %), tumor supresorové geny (15,5 %),
geny spojené s metylací DNA (43,5 %), signální geny (59 %), geny modifikující chromatin (30,5 %), geny pro myeloidní transkripční faktory (22 %), geny kohesinového komplexu (13 %) a spliceosomální geny (13,5 %) [ 25] . |
adrenokortikální karcinom | 92 | Mutace v genech PRKAR1A, RPL22, TERF2, CCNE1 a NF1. Rovněž byla zjištěna častá ztráta velké části DNA následovaná zdvojením celého genomu, zvýšená exprese TERT, zkrácení délky telomer a aktivace programů buněčného cyklu [26] . |
Uroteliální karcinom močového měchýře | 412 | Významné opakující se mutace ve 32 genech, včetně genů zapojených do regulace buněčného cyklu, regulace chromatinu a kinázových signálních drah. Byly identifikovány periodické in-frame fúze FGFR3-TACC3, stejně jako exprese a integrace několika virů (včetně HPV16) [27] . |
Gliom mozku 2. stupně | 516 | Mutace IDH a delece 1p/19q jsou doprovázeny mutacemi v genech CIC, FUBP1, NOTCH1 a promotoru genu TERT, genomové aberace jsou podobné jako u glioblastomu [28] . |
Invazivní karcinom prsu | 1098 | Somatické mutace tří genů TP53, PIK3CA a GATA3 byly pozorovány ve > 10 % případů, v některých případech byly detekovány specifické mutace genů GATA3, PIK3CA a MAP3K1 [29] . Byla také identifikována ztráta genu E-cadherin a mutace v genech PTEN, TBX3 a FOXA1 [30] . |
Rakovina děložního hrdla | 307 | Mutace v genech SHKBP1, ERBB3, CASP8, HLA-A a TGFBR2. Amplifikace byly také nalezeny v imunitních cílech CD274/PD-L1 a PDCD1LG2/PD-L2. Integrace HPV virů byla pozorována ve všech případech infekce HPV18 a v 76 % případů infekce HPV16, doprovázená různými strukturálními aberacemi a zvýšenou expresí cílové DNA. U HPV-negativních nádorů byly identifikovány časté mutace genů KRAS, ARID1A a PTEN [31] . |
Cholangiokarcinom | 51 | IDH mutace doprovázené nízkou expresí modifikátorů chromatinu, zvýšenou expresí mitochondriálních genů a zvýšeným počtem kopií mitochondriální DNA [32] . |
Adenokarcinom tlustého střeva | 461 | Mutace v genech APC, TP53, SMAD4, PIK3CA, KRAS, ARID1A, SOX9 a FAM123B/WTX, amplifikace ERBB2, IGF2, fúze NAV2 a TCF7L1 (součást signální dráhy WNT), hypermethylace a umlčení 75ML % případů [33] . |
Karcinom jícnu | 185 | Časté genomové amplifikace CCND1 a SOX2 a/nebo TP63 u spinocelulárního karcinomu a amplifikace ERBB2, VEGFA a GATA4 a/nebo GATA6 u adenokarcinomů [34] . |
Multiformní glioblastom | 617 | Mutace v EGFR, NF1, TP53, PlK3R1, PIK3CA, IDH1, PTEN, RB1, LZTR1 [35] , mutace v genech modifikujících chromatin ve 40 % případů [36] . |
Spinocelulární karcinom hlavy a krku | 528 | Převládají mutace onkogenu PIK3CA, ztráta genu TRAF3 a amplifikace genu buněčného cyklu E2F1. U nádorů způsobených kouřením jsou pozorovány mutace TP53, inaktivace CDKN2A a amplifikace 3q26/28 a 11q13/22 WNT a aktivace faktoru oxidativního stresu NFE2L2 [37] . Také amplifikace genu TP63 a zvýšená exprese imunitních a proliferačních genů [38] . |
Chromofobní karcinom ledviny | 113 | Mutace v promotorové oblasti genu TERT, zvýšená exprese tohoto genu [39] . |
Hypernefroidní rakovina | 537 | Mutace ve VHL , PBRM1, ARID1A, SMARCA4, mutace v genech dráhy PI(3)K/AKT, změny v genech Krebsova cyklu, pentózofosfátové dráhy a genů přenašeče glutaminu, změny v metylaci MiR-21 a GRB10 promotor [40] . |
papilární rakovina ledvin | 291 | Mutace MET nebo SETD2, umlčení CDKN2A, fúze TFE3, nadměrná exprese NRF2, součást signální dráhy ARE [41] . |
Hepatocelulární karcinom | 377 | |
Plicní adenokarcinom | 585 | Mutace v RIT1, MGA, EGFR (častěji u žen), RBM10 (častěji u mužů), aberace v NF1, MET, ERBB2 a RIT1 byly detekovány ve 13 % případů [42] . |
Spinocelulární karcinom plic | 504 | Mutace v TP53, mutace v hlavním genu histokompatibility HLA-A třídy I, mutace v genech skvamózní diferenciace, genech dráhy PI(3)K, stejně jako mutace v genech NFE2L2, KEAP1, CDKN2A a RB1 [43] , amplifikace gen TP63, zvýšená expresní imunita a proliferační geny [38] . |
Difuzní velkobuněčný B lymfom | 58 | |
mezoteliom | 87 | |
Serózní cystadenokarcinom vaječníků | 608 | Mutace v TP53 byly detekovány v 96 % studovaných případů; mutace v NF1, BRCA1, BRCA2, RB1 a CDK12, metylace promotoru 168 genů a významné aberace kopií 113 genů, bylo také zjištěno, že homologní rekombinační systém byl poškozen asi v polovině případů [44] . |
Adenokarcinom slinivky břišní | 185 | |
Feochromocytom a paragangliom | 179 | Mutace v genech CSDE1, HRAS, RET, EPAS1 a NF1, různé fúze genů MAML3, BRAF, NGFR a NF1 [45] . |
adenokarcinom prostaty | 500 | Fúze genů ERG, ETV1/4 a FLI1 nebo mutace genů SPOP, FOXA1 a IDH1 byly detekovány v 74 % případů, abnormality v signálních drahách PI3K nebo MAPK byly detekovány u 25 % případů rakoviny a inaktivace DNA opravné geny byly také pozorovány u 19 % [46] . |
Adenokarcinom konečníku | 172 | Mutace v genech APC, TP53, SMAD4, PIK3CA, KRAS, ARID1A, SOX9 a FAM123B/WTX, amplifikace ERBB2, IGF2, fúze NAV2 a TCF7L1 (součást signální dráhy WNT), hypermethylace a umlčení 75ML % případů [33] . |
Sarkom | 261 | |
Kožní melanom | 470 | Mutace v BRAF, RAS, NF1, KIT [47] . |
Adenokarcinom žaludku | 443 | Mutace v genu PIK3CA, zvýšená hladina metylace DNA, amplifikace genů JAK2, CD274 a PDCD1LG2 [48] . |
Nádory testikulárních embryonálních buněk | 150 | |
thymom | 124 | |
Karcinom štítné žlázy | 507 | EIF1AX, PPM1D, CHEK2 a různé genové fúze [49] . |
Karcinosarkom dělohy | 57 | Mutace v genech TP53, PTEN, PIK3CA, PPP2R1A, FBXW7 a KRAS [50] . |
Sarkom endometria dělohy | 560 | Malý počet změn v počtu kopií nebo mutací genu TP53, časté mutace v PTEN, CTNNB1, PIK3CA, ARID1A, KRAS, ARID5B [51] . |
Uveální melanom | 80 |