Encyklopedie prvků DNA

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 10. února 2017; kontroly vyžadují 17 úprav .
ZAKÓDOVAT
Obsah
Popis Databáze celého genomu
Kontakty
Výzkumné centrum Kalifornská univerzita Santa Cruz
Laboratoř Centrum pro biomolekulární vědu a inženýrství
Autoři Brian J Raney [1]
Původní publikace PMID 21037257
Datum vydání 2010
Dostupnost
webová stránka encodeproject.org

Encyklopedie prvků DNA ( ENCODE  ) je mezinárodní výzkumné konsorcium založené v září 2003 . Organizuje a financuje americký Národní institut pro výzkum lidského genomu ( NHGRI ) [1] [2] [3] . ENCODE, koncipovaný jako pokračování projektu Human Genome Project, si klade za cíl provést kompletní analýzu funkčních prvků lidského genomu . Veškeré výsledky získané během realizace projektu jsou publikovány ve veřejných databázích .  

Dne 5. září 2012 byly publikovány první výsledky projektu v podobě 30 propojených publikací na webových stránkách časopisů " Nature ", " Genome Biology " a " Genome Research " [4] [ 5] . Tyto publikace ukazují, že nejméně 80 % lidského genomu je biologicky aktivních, do té doby dominovala představa, že většina DNA byla „ junk “. Takové unáhlené závěry jsou však kritizovány mnoha vědci, kteří poukazují na nedostatek potřebných důkazů pro funkčnost těchto prvků [6] .

Relevance

Odhaduje se, že lidský genom obsahuje 20 000 genů kódujících protein (dohromady tvoří exom ) a tvoří pouze asi 1,5 % DNA lidského genomu. Primárním cílem projektu ENCODE je určit funkci zbytku genomu, z nichž většina byla tradičně považována za „ nevyžádané “ (například DNA, která není transkribována ).

Přibližně 90 % jednonukleotidových polymorfismů v lidském genomu (u kterých bylo prokázáno, že jsou spojeny s různými nemocemi pomocí celogenomových asociačních studií) se nachází mimo oblasti kódující protein. [7]

Aktivita a exprese genů kódujících protein může být regulována regulomem - různými prvky DNA, jako je promotor , regulační sekvence a oblasti chromatinu , stejně jako modifikace histonů . Předpokládá se, že změny v regulačních oblastech mohou narušit expresi proteinů a buněčnou funkci, a tak vést k onemocněním ( ENCODE Project Background ). Stanovením umístění regulačních elementů a jejich vlivu na transkripci je možné objasnit vztah mezi změnami v hladinách exprese konkrétních genů a rozvojem onemocnění. [osm]

ENCODE má být komplexním zdrojem, který vědecké komunitě umožní lépe porozumět tomu, jak může genom ovlivnit lidské zdraví a stimulovat vývoj nových metod prevence a léčby nemocí. [9]

K dnešnímu dni projekt pomáhá při objevování nových regulačních prvků DNA, poskytuje nové poznatky o organizaci a regulaci našich genů a genomu a také o tom, jak mohou změny v sekvenci DNA ovlivnit vývoj nemocí. [7] Jedním z hlavních výsledků projektu je popis, že bylo prokázáno, že 80 % lidského genomu je spojeno s alespoň jednou biochemickou funkcí. [10] [11] Většina této nekódující DNA se podílí na regulaci exprese kódujících genů. [10] Kromě toho je exprese každého kódujícího genu řízena řadou regulačních oblastí umístěných v blízkosti i ve vzdálenosti od genu. Tyto výsledky ukazují, že regulace genů je mnohem složitější, než se dříve myslelo. [12]

Projekt ENCODE

Projekt ENCODE je realizován ve třech fázích: počáteční fáze, fáze vývoje technologie a produktivní fáze.

Během počáteční fáze konsorcium ENCODE vyhodnotilo strategie pro identifikaci různých typů prvků genomu . Cílem počáteční fáze bylo definovat soubor postupů, které by společně umožnily přesnou a podrobnou charakterizaci velkých oblastí lidského genomu s přihlédnutím k ekonomické životaschopnosti a vysoké účinnosti procesu. Počáteční fází bylo identifikovat mezery v sadě nástrojů pro definování funkčních sekvencí a také ukázat, zda některá z použitých metod nebyla shledána jako neefektivní nebo nevhodná pro škálování. Některé z těchto problémů bylo nutné řešit ve fázi vývoje technologie ENCODE (souběžně s počáteční fází projektu), která měla za cíl vyvinout nové laboratorní a výpočetní metody, které by zlepšily identifikaci známých funkčních sekvencí nebo studium nových funkční prvky genomu. Výsledek prvních dvou fází na příkladu studia 1 % lidského genomu určil nejlepší způsob, jak analyzovat zbývajících 99 % s maximální efektivitou a nejnižšími náklady během produktivní fáze. [9]

Fáze I projektu ENCODE: počáteční fáze

Během pilotní fáze byl proveden výzkum a porovnání existujících metod pro důkladnou analýzu určitého úseku sekvence lidského genomu. Bylo organizováno jako otevřené konsorcium a sdružovalo výzkumníky z různých prostředí a zázemí, aby posoudili přednosti každé techniky, technologie a strategie z různorodého souboru. Současně bylo cílem technologické vývojové fáze projektu vyvinout nové, vysoce účinné metody určování funkčních prvků. Cílem této práce bylo stanovit soubor přístupů, které by umožnily co nejpřesnější určení všech funkčních prvků v lidském genomu. Během počáteční fáze byla stanovena schopnost různých metod škálovat pro analýzu celého lidského genomu a byly identifikovány mezery v definici funkčních prvků v sekvenci genomu.

Počáteční fáze projektu probíhala v úzké spolupráci experimentátorů a teoretiků, což umožnilo vyhodnocení řady metod pro anotaci lidského genomu. Jako cíl pro počáteční fázi projektu byl vybrán soubor regionů představujících přibližně 1 % (30 Mb) lidského genomu a byl analyzován všemi účastníky pilotní fáze projektu. Všechna data o těchto regionech získaná účastníky ENCODE byla rychle uvolněna do veřejných databází. [13] [14]

Výsledky fáze I [13]
  • Lidský genom je transkribován všudypřítomně, takže většina jeho bází je spojena s alespoň jedním primárním transkriptem a mnoho transkriptů spojuje distální oblasti se specifickými lokusy kódujícími protein.
  • Byla identifikována řada nových transkriptů nekódujících protein, z nichž mnohé překrývají lokusy kódující protein a další lokusy umístěné v oblastech genomu, které byly dříve považovány za transkripčně tiché.
  • Bylo identifikováno mnoho dříve nerozpoznaných míst počátku transkripce, z nichž mnohé vykazují chromatinovou strukturu a vazebné vlastnosti specifické pro proteinovou sekvenci podobné dobře charakterizovaným promotorům.
  • Regulační sekvence, které obklopují místa počátku transkripce, jsou distribuovány symetricky, bez posunu směrem k překrývajícím se oblastem.
  • Dostupnost chromatinu a vzory modifikace histonů jsou vysoce prediktivní pro přítomnost i aktivitu míst počátku transkripce.
  • Distální hypersenzitivní místa DNázyI mají charakteristické vzorce modifikace histonů, které je spolehlivě odlišují od promotorů.
  • Doba replikace DNA koreluje se strukturou chromatinu.
  • Celkem 5 % bází v genomu lze s jistotou identifikovat jako pod evolučním omezením u savců; pro asi 60 % těchto omezených základen existují důkazy o jejich fungování na základě dosud provedených experimentálních analýz.
  • Různé funkční prvky se velmi liší ve své sekvenční variabilitě v lidské populaci a v jejich pravděpodobnosti, že jsou ve strukturně variabilní oblasti genomu.
  • Překvapivě se zdá, že mnoho funkčních prvků není omezeno na evoluci savců. To naznačuje možnost velkého množství neutrálních prvků, které jsou biochemicky aktivní, ale neposkytují tělu velký přínos. Tento bazén může sloužit jako „skladiště“ přirozeného výběru, potenciálně působit jako zdroj liniově specifických prvků a funkčně konzervovaných, ale neortologních prvků mezi druhy.

Fáze II projektu ENCODE: produktivní fáze

V září 2007 začalo financování produktivní fáze projektu ENCODE. V této fázi bylo cílem analyzovat celý genom a provést "dodatečné studie v průmyslových podmínkách. " [15]

Stejně jako v počáteční fázi byla práce v produktivní fázi organizována jako otevřené konsorcium. V říjnu 2007 jí Národní institut pro výzkum lidského genomu přidělil granty v celkové výši více než 80 milionů dolarů na 4 roky. [16] Během produktivní fáze projekt zahrnoval Data Coordination Center, Data Analysis Center a Technology Development Center. [17] V tuto chvíli se projekt mění ve skutečně masivní podnik, do kterého se zapojilo 440 vědců z 32 laboratoří z celého světa. V roce 2007, kdy byla dokončena počáteční fáze, projekt navýšil kapacitu z velké části díky řazení nové generace . Skutečně bylo zpracováno mnoho dat, výzkumníci získali asi 15 terabajtů nezpracovaných informací.

Do roku 2010 získal projekt ENCODE více než 1 000 datových sad pro celý genom. Dohromady tato data ukazují, které oblasti zřejmě řídí expresi genů používaných v určitých typech buněk a které oblasti interagují s velkým množstvím proteinů. Projekt poskytuje informace o transkripčních místech, jejich souvisejících transkripčních faktorech, struktuře chromatinu a modifikacích histonů.

Výsledky fáze II [18]
  • Naprostá většina (80,4 %) lidského genomu se účastní alespoň jedné biochemické události spojené s RNA a/nebo chromatinem v alespoň jednom buněčném typu. Většina genomu se nachází v blízkosti regulačních událostí: 95 % genomu je do 8 kilobází od interakce DNA-protein (jak bylo měřeno analýzou motivu ChIP-seq nebo vazbou DNázy I) a 99 % je do 1,7 kilobází od alespoň jeden z biochemických událostí prezentovaných ENCODE.
  • Klasifikace genomu do sedmi chromatinových stavů naznačuje počáteční soubor 399 124 oblastí s vlastnostmi podobnými zesilovači a 70 292 oblastí s vlastnostmi podobnými promotoru, stejně jako stovky tisíc nepohyblivých oblastí. Analýza s vysokým rozlišením dále rozděluje genom do tisíců úzkých stavů s různými funkčními vlastnostmi.
  • Generování a zpracování RNA sekvence může být kvantitativně korelováno jak s chromatinovými značkami, tak s vazbou transkripčního faktoru (TF) na promotory, což ukazuje, že funkčnost promotoru může odpovídat za velkou část variací v expresi RNA.
  • Mnoho nekódujících variant v jednotlivých sekvencích genomu leží ve funkčních oblastech anotovaných ENCODE; toto číslo je přinejmenším tak vysoké jako ty obsažené v genech kódujících proteiny.
  • SNP spojené s onemocněním pomocí GWAS jsou obohaceny o nekódující funkční prvky, z nichž většina se nachází v určitých oblastech definovaných ENCODE nebo v jejich blízkosti, mimo geny kódující protein. V mnoha případech mohou být fenotypy onemocnění spojeny s konkrétním buněčným typem nebo transkripčním faktorem.
  • Konsorcium ENCODE

ENCODE Consortium je primárně tvořeno vědci, kteří jsou sponzorováni americkým Národním institutem pro výzkum lidského genomu . Dalšími účastníky projektu jsou členové Konsorcia nebo Analytické pracovní skupiny.

Počáteční fáze projektu sestávala z osmi studijních skupin a dvanácti skupin účastnících se fáze technologického vývoje projektu ENCODE ( ENCODE Pilot Project: Participants and Projects ). Do konce roku 2007, kdy pilotní fáze projektu oficiálně skončila, se počet účastníků rozrostl na 440 vědců z 32 laboratoří z celého světa. V současné době se konsorcium skládá z různých center, která plní různé úkoly ( ENCODE Účastníci a projekty ):

  1. Výrobní střediska (ENCODE Production Centers)
  2. Koordinační centrum dat (ENCODE Data Coordination Center)
  3. Centrum analýzy dat (ENCODE Data Analysis Center)
  4. Výpočetní analýza výsledků (ENCODE Computational Analysis Awards)
  5. Technologický vývoj (ENCODE Technology Development Effort)

Prezentované údaje

Od roku 2007 provedli účastníci projektu ENCODE velké množství studií založených na různých biologických sekvencích s cílem zmapovat funkční prvky lidského genomu [19] . Mapované prvky (a použité přístupy) zahrnují oblasti transkripce RNA (RNA-seq, CAGE, RNA-PET a manuální anotace), oblasti kódující protein (hmotnostní spektrometrie), vazebná místa pro transkripční faktor (ChIP-seq a DNase-seq), struktura chromatinu (DNase-seq, FAIRE-seq, histon ChIP-seq a MNase-seq) a místa methylace DNA (RRBS analýza). Níže je uveden podrobný popis údajů získaných účastníky projektu za léta jeho práce a prezentovaných na webových stránkách projektu.

Transkribované a proteinové kódující oblasti

Projekt použil manuální a automatizovanou anotaci k vytvoření komplexního katalogu lidských proteinů kódujících a nekódujících RNA a pseudogenů, nazvaný GENCODE. [20] [21] Katalog obsahuje 20 687 genů kódujících protein, s průměrem 6,3 alternativně sestřižených na lokus.

Kromě toho bylo anotováno 8801 automaticky generovaných malých RNA a 9640 ručně upravených dlouhých nekódujících RNA (lncRNA). Srovnání lncRNA s jinými daty ENCODE ukazuje, že lncRNA jsou generovány cestou podobnou genům kódujícím protein. [22] Projekt GENCODE také anotoval 11 224 pseudogenů, z nichž 863 je transkribovaných a asociovaných s aktivním chromatinem. [23]

RNA

  • RNA byly sekvenovány z 16 různých buněčných linií a více subcelulárních frakcí, aby se vyvinul rozsáhlý katalog exprese RNA. Za předpokladu, že se k identifikaci oblastí aktivity RNA použije konzervativní práh, je 62 % genomových bází reprodukovatelně zastoupeno v sekvenovaných dlouhých (>200 nukleotidů) molekul RNA nebo exonech GENCODE.
  • K identifikaci 62 403 míst počátku transkripce (TSS) s vysokou spolehlivostí (IDR 0,01) byla použita metoda CAGE-seq (izolace a sekvenování cílové RNA s 5' čepičkou).
  • Nakonec byla nalezena významná část kódujících a nekódujících transkriptů, které byly zpracovány na perzistentní stabilní RNA kratší než 200 nukleotidů. Mezi tyto prekurzory patří transferová RNA, miRNA , malá jaderná RNA a malá nukleární RNA ( tRNA , miRNA , snRNA a snoRNA, v tomto pořadí)

Místa vázající proteiny

Pro přímou identifikaci regulačních oblastí účastníci projektu zmapovali vazebná místa 119 různých DNA-vazebných proteinů a řadu složek RNA polymerázy v 72 buněčných typech pomocí ChIP-seq. [24] Každé vazebné místo bylo zkoumáno na obohacení o známé vazebné motivy DNA a na přítomnost nových motivů.

Oblasti genomu přecitlivělé na DNázu I

Přístupnost chromatinu, charakterizovaná hypersenzitivitou DNázy I, je charakteristickým znakem regulačních oblastí DNA. [25] [26] Účastníci projektu zmapovali 2,89 milionu unikátních, nepřekrývajících se míst hypersenzitivity DNázy I (DHS) pomocí DNase-seq ve 125 typech buněk.

Stránky pro modifikaci histonů

Byla analyzována chromozomální umístění 12 histonových modifikací ve 46 buněčných typech. Získaná data ukazují, že globální vzorce modifikace se velmi liší pro různé typy buněk v souladu se změnami v transkripční aktivitě. Bylo zjištěno, že integrace různých informací o modifikaci histonů může být systematicky použita k přiřazení funkčních atributů genomovým oblastem. [27]

Methylace DNA

Metylace cytosinu (obvykle na CpG dinukleotidech) se podílí na epigenetické regulaci genové exprese. Metylace promotoru je často spojena s represí, zatímco methylace genu koreluje s transkripční aktivitou. [28] Účastníci projektu použili metodu RRBS (Restricted Genomic Loci Set Bisulfite Sequencing) ke kvantitativnímu profilu metylace DNA pro průměrně 1,2 milionu CpG v každé z 82 buněčných linií a tkání, včetně CpG v intergenových oblastech proximálních promotorů a oblastí uvnitř gen (těla genů). [29]

Místa interakcí chromozomů

Fyzické interakce mezi jednotlivými oblastmi chromozomů, které mohou být odděleny stovkami kilobází, jsou považovány za důležité v regulaci genové exprese 46. Metoda 5C odhalila dálkové interakce s místy startu transkripce (TSS) v cílovém 1 % genom (44 pilotních oblastí ENCODE) ve čtyřech typech buněk (GM12878, K562, HeLa-S3 a H1 hESC) 49. Po zohlednění chování chromatinového polymeru a experimentálních variací byly v každém typu buňky nalezeny stovky statisticky významných interakcí na dlouhé vzdálenosti. Páry interagujících lokusů vykazovaly silnou korelaci mezi úrovní exprese genu TSS a přítomností určitých tříd funkčních prvků, jako jsou enhancery . Průměrný počet distálních elementů interagujících s TSS byl 3,9 a průměrný počet TSS interagujících s distálním elementem byl 2,5, což ukazuje na komplexní síť vzájemně propojených chromatinu. Tato propletená architektura "dlouhého dosahu" byla také odhalena napříč genomem analýzou interakcí chromatinu s párovým sekvenováním koncových značek ( ChIA-PET ) používanou k detekci interakcí v chromatinu obohaceném RNA polymerázou II (Pol II) v pěti typech buněk. [třicet]

Kritika

Navzdory tvrzením konsorcia, že projekt ENCODE není zdaleka u konce, jsou ohlasy na již publikované články a tiskové zprávy pozitivní. Redaktoři časopisu Nature a autoři projektu ENCODE píší: „... spolupracovali jsme mnoho měsíců, abychom vytvořili co největší rozruch, který přitáhne pozornost nejen vědecké komunity, ale i široké veřejnosti“ („... spolupracovali po mnoho měsíců, aby udělali co největší rozruch a upoutali pozornost nejen výzkumné komunity, ale i široké veřejnosti“). [31] Tvrzení předložené projektem ENCODE, že 80 % lidského genomu má biochemickou funkci [10] , bylo rychle převzato populárně vědeckými publikacemi, které charakterizovaly výsledky projektu jako způsobující smrt „nevyžádané“ DNA. . [32] [33]

Nicméně závěr, že většina genomu je „funkční“, byl kritizován na základě toho, že projekt ENCODE definuje „funkčnost“ příliš široce, totiž že vše, co je v buňce transkribováno, má nějakou funkci. Tento závěr byl učiněn navzdory obecně přijímanému názoru, že mnoho prvků DNA, které jsou transkribovány , jako jsou pseudogeny , přesto není funkční. Projekt ENCODE navíc zdůrazňoval spíše senzitivitu než specifičnost, což vedlo k mnoha falešným pozitivům . [34] [35] [36] Poněkud svévolný výběr buněčných linií a transkripčních faktorů , stejně jako nedostatek nezbytných kontrolních experimentů, se staly dalším zdrojem vážné kritiky ENCODE, protože náhodná molekula DNA může napodobovat "funkční" chování v interpretacích ENCODE. [37]

V reakci na tyto kritiky se tvrdilo, že většina transkripce a sestřihu genomu , jak je vidět u lidí, je přesnějším indikátorem genetické funkce než konzervatismus sekvence. Většina „junk“ DNA se navíc podílí na epigenetické regulaci a byla nezbytným předpokladem pro vývoj složitých organismů. [38] V reakci na připomínky k definici slova „funkční“ mnozí poznamenali, že v tomto případě se spor týká rozdílu v definici, a nikoli podstaty projektu, kterým je poskytnout data pro následné studie biochemické aktivita oblastí DNA nekódujících protein. Zatímco definice jsou důležité a věda se omezuje na jazyk, zdá se, že ENCODE splnilo svůj účel, protože velké množství výzkumných prací v současné době používá data generovaná projektem spíše než probírání definic „funkčnosti“. [39] Ewan Birney, jeden z výzkumníků ENCODE, komentoval některé reakce na projekt. Poznamenává, že slovo „funkce“ bylo použito pragmaticky k označení „určité biochemické aktivity“, která se projevuje v různých třídách experimentů různými způsoby: přítomnost RNA , modifikace histonů , oblasti hypersenzitivní DNaseI , vrcholy transkripčních faktorů ChIP-seq . , DNA footprinting , vazebná místa a exony transkripčních faktorů . [40]

Projekt byl navíc kritizován za svůj vysoký rozpočet (celkem asi 400 milionů dolarů) a záštitu nad takzvanou „velkou vědou“, základním vědeckým výzkumem, který bere peníze z produktivnějšího vědeckého vývoje, který je třeba provádět v náklady samotných výzkumníků. [41] Počáteční fáze projektu ENCODE byla odhadnuta na 55 milionů USD, jeho rozšíření stálo přibližně 130 milionů USD a americký Národní institut pro výzkum lidského genomu byl připraven vyčlenit na další fázi projektu až 123 milionů USD. Někteří badatelé tvrdí, že řádná návratnost investic ještě nenastala. Ve snaze spočítat všechny publikace, ve kterých ENCODE hraje významnou roli, bylo od roku 2012 identifikováno 300 takových článků, z nichž 110 bylo založeno na výsledcích z laboratoří bez financování ENCODE. Dalším problémem bylo, že ENCODE není jedinečný název odkazující pouze na projekt ENCODE, takže slovo 'kódovat' (zakódovat) se objevuje v mnoha literatuře o genetice a výzkumu genomu . [7]

Jako další hlavní komentář se uvádí, že výsledky neospravedlňovaly množství stráveného času a že projekt je v zásadě nekonečný. Přestože byl srovnáván s Human Genome Project a dokonce nazýván jeho pokračováním, The Human Genome má jasný konec, který ENCODE aktuálně postrádá.

Autoři projektu zjevně sdílejí obavy vědeckého světa a nepopírají existenci problémů, ale zároveň se snaží své snahy ospravedlnit vysvětlováním detailů projektu v rozhovorech nejen vědecké komunitě, ale i do médií. Říkají, že od pochopení, že DNA  je materiálním základem dědičnosti k rozluštění sekvence lidského genomu , trvalo více než půl století , takže jejich plánem pro příští století je porozumět této sekvenci [7] .

Další projekty

V současné době je konsorcium ENCODE zapojeno do několika dalších projektů s podobnými cíli. Některé z těchto projektů byly součástí druhé fáze ENCODE.

modENCODE

Analogicky k projektu ENCODE byl zahájen také projekt mapování funkčních prvků genomu hlavních modelových objektů  - Drosophila melanogaster a Caenorhabditis elegans  - anglicky.  Modelový organismus ENCyklopedie prvků DNA (modENCODE) . Výhodou tohoto projektu je možnost provádění některých experimentů na modelových organismech, které jsou na člověku obtížně či nemožné. [42]

Projekt byl založen v roce 2007 Národním institutem zdraví ( NIH ). [  43] [44] V roce 2010 konsorcium modENCODE představilo v časopise Science řadu článků o anotaci a analýze distribuce funkčních prvků v genomu Drosophila melanogaster a Caenorhabditis elegans Údaje z těchto publikací jsou k dispozici na webu modENCODE [45] .

V současnosti je modENCODE výzkumným konglomerátem 11 semenných projektů rozdělených mezi D. melanogaster a C. elegans research . Projekt pokrývá výzkum v následujících oblastech:

moderní

modERN (  modelový organismus Encyklopedie regulačních sítí ) je odnoží modENCODE .  Projekt kombinuje výzkum skupin C. elegans a D. melanogaster a zaměřuje se na identifikaci dalších vazebných míst transkripčních faktorů. Projekt byl zahájen souběžně s třetí fází ENCODE a jeho dokončení je naplánováno na rok 2017. K dnešnímu dni modERN publikoval výsledky 198 experimentů, dalších 500 bylo přijato k publikaci a jsou zpracovávány clearingovým centrem dat ENCODE.

Genomika regulace genů

Program Genomics of   Gene Regulation (GGR) byl zahájen počátkem roku 2015 americkým National Institutes of Health a bude probíhat tři roky. Cílem programu je studovat genové sítě a cesty v různých tělesných systémech, aby se dále pokročilo v porozumění mechanismům, které řídí genovou expresi. Přestože je projekt ENCODE oddělený od GGR, ENCODE Data Clearinghouse spravuje data GGR na svém portálu.

Cestovní mapa

V roce 2008 zorganizovalo  Konsorcium pro mapování epigenomických plánů USA National Institutes of Health s cílem vytvořit veřejný zdroj epigenetických dat lidského genomu pro biologický a lékařský výzkum. Na základě výsledků práce zveřejnilo konsorcium v ​​únoru 2015 článek „Integrativní analýza 111 referenčních lidských epigenomů“. Konsorcium shromáždilo a anotovalo regulační prvky ve 127 referenčních epigenomech, z nichž 16 bylo součástí projektu ENCODE. Data projektu Roadmap jsou dostupná na portálech Roadmap nebo ENCODE .  

fruitENCODE

Projekt fruitENCODE: encyklopedie prvků DNA zrajícího ovoce, součást ENCODE. Cílem projektu je generovat datové sady: místa metylace DNA, modifikace histonů, oblasti hypersenzitivního chromatinu DNázy I, genová exprese, vazebná místa transkripčních faktorů pro šťavnaté plody všeho druhu v různých fázích vývoje. Předběžné datum zveřejnění výsledků je zveřejněno na portálu fruitENCODE .

Faktorbook

Data o vazbě transkripčních faktorů získaná pomocí ENCODE jsou v současnosti dostupná na Factorbook.org [47]  , databázi založené na wiki. První číslo FactorBook obsahuje:

  • 457 datových souborů ChIP-seq pro 119 transkripčních faktorů v některých lidských buněčných kulturách
  • Průměrné profily modifikací histonů a umístění nukleozomů kolem vazebných míst transkripčního faktoru
  • Motivy, které obohacují vazebná místa, stejně jako vzdálenost mezi nimi a jejich orientace [48]

Viz také

Poznámky

  1. 1 2 Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K., Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H., Zweig AS, Kirkup V. , Fujita PA, Rhead B., Smith KE, Pohl A., Kuhn RM, Karolchik D., Haussler D., Kent, WJ . ENCODE data celého genomu v prohlížeči genomu UCSC (aktualizace z roku 2011  )  // Nucleic Acids Res. : deník. - 2011. - Leden ( roč. 39 , č. Vydání databáze ). - P.D871-5 . doi : 10.1093 / nar/gkq1017 . — PMID 21037257 .
  2. EGASP: projekt hodnocení anotace lidského genomu ENCODE.  (anglicky) . PubMed .
  3. Kleshchenko E. DNA bez smetí  // Nové časy. - 2012. - Vydání. 29 (256) .
  4. Projekt ENCODE na UCSC (downlink) . Konsorcium ENCODE. Získáno 5. září 2012. Archivováno z originálu 10. září 2012. 
  5. Walsh, Fergus . Podrobná mapa funkce genomu  (5. září 2012). Archivováno z originálu 5. září 2012. Staženo 6. září 2012.
  6. Blog Dana Graura .
  7. 1 2 3 4 Maher B. KÓDOVAT: Lidská encyklopedie   // Příroda . - 2012. - září ( roč. 489 , č. 7414 ). - str. 46-8 . - doi : 10.1038/489046a . — PMID 22962707 .
  8. Saey, Tina Hesman Team vydává pokračování lidského genomu . Společnost pro vědu & veřejnost (6. října 2012). Staženo: 18. října 2012.
  9. 1 2 Konsorcium projektu ENCODE. Projekt ENCODE (ENCyklopedie prvků DNA) . Věda (2004).
  10. 1 2 3 Bernstein BE, Birney E., Dunham I., Green ED, Gunter C., Snyder M. Integrovaná encyklopedie prvků DNA v lidském genomu  //  Nature : journal. - 2012. - září ( roč. 489 , č. 7414 ). - str. 57-74 . - doi : 10.1038/příroda11247 . — . — PMID 22955616 .
  11. Timmer J. Většina toho, co jste četli, byla špatná: jak tiskové zprávy přepsaly vědeckou historii . Staff / From the Minds of Ars . Ars Technica (10. září 2012). Staženo: 10. září 2012.
  12. Pennisi E. Genomika. Projekt ENCODE píše chvalozpěv na nevyžádanou DNA  (anglicky)  // Science : journal. - 2012. - Září ( roč. 337 , č. 6099 ). - str. 1159, 1161 . - doi : 10.1126/science.337.6099.1159 . — PMID 22955811 .
  13. 1 2 Birney E. , Stamatoyannopoulos JA , Dutta A. et al. Identifikace a analýza funkčních prvků v 1 % lidského genomu pilotním projektem ENCODE.  (anglicky)  // Nature. - 2007. - Sv. 447, č.p. 7146 . - S. 799-816. - doi : 10.1038/nature05874 . — PMID 17571346 .
  14. Zaměstnanci programu ENCODE. ENCODE: Pilotní projekt: přehled . Národní ústav pro výzkum lidského genomu (18. října 2012).
  15. Genome.gov | Projekty ENCODE a modENCODE . Projekt ENCODE: ENCyklopedie prvků DNA . United States National Human Genome Research Institute (1. srpna 2011). Staženo: 5. srpna 2011.
  16. National Human Genome Research Institute - Organization . Almanach NIH . Národní institut zdraví Spojených států. Staženo: 5. srpna 2011.
  17. Genome.gov | ENCODE Účastníci a projekty . Projekt ENCODE: ENCyklopedie prvků DNA . United States National Human Genome Research Institute (1. srpna 2011). Staženo: 5. srpna 2011.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. ENCODE vysvětleno   // Příroda . — 2012-09. — Sv. 489 , iss. 7414 . — S. 52–54 . — ISSN 1476-4687 . - doi : 10.1038/489052a .
  19. Konsorcium projektu ENCODE. A User's Guide to the Encyclopedia of DNA Elements (ENCODE  )  // PLOS Biology. — 2011-04-19. — Sv. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  20. Jennifer Harrow, Adam Frankish, Jose M. Gonzalez, Electra Tapanari, Mark Diekhans. GENCODE: Referenční anotace lidského genomu pro projekt ENCODE  //  Genome Research. — 2012-09-01. — Sv. 22 , iss. 9 . — S. 1760–1774 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.135350.111 .
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Kombinace RT-PCR-seq a RNA-seq pro katalogizaci všech genových elementů kódovaných v lidském genomu  //  Genome Research. — 2012-09-01. — Sv. 22 , iss. 9 . — S. 1698–1710 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.134478.111 .
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. Katalog lidských dlouhých nekódujících RNA GENCODE v7: Analýza jejich genové struktury, evoluce a exprese  //  Výzkum genomu. — 2012-09-01. — Sv. 22 , iss. 9 . - S. 1775-1789 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.132159.111 .
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cedric Howald, Lukas Habegger. Zdroj pseudogenu GENCODE  // Genome Biology. — 2012-09-05. - T. 13 , č.p. 9 . - S. R51 . — ISSN 1474-760X . - doi : 10.1186/cz-2012-13-9-r51 .
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. Architektura lidské regulační sítě odvozená z dat ENCODE   // Nature . — 2012-09. — Sv. 489 , iss. 7414 . — S. 91–100 . — ISSN 1476-4687 . - doi : 10.1038/příroda11245 .
  25. David S. Gross, William T. Garrard. Místa přecitlivělá na nukleázu v chromatinu  // Annual Review of Biochemistry. - 1988-06-01. - T. 57 , č.p. 1 . — S. 159–197 . — ISSN 0066-4154 . - doi : 10.1146/annurev.bi.57.070188.001111 .
  26. Fjodor D. Urnov. Remodelace chromatinu jako průvodce transkripčními regulačními sítěmi u savců  (fr.)  // Journal of Cellular Biochemistry. - 2003. - Sv. 88 , livr. 4 . — S. 684–694 . — ISSN 1097-4644 . - doi : 10.1002/jcb.10397 .
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Mapování a analýza dynamiky stavu chromatinu v devíti typech lidských buněk   // Nature . — 2011-05. — Sv. 473 , iss. 7345 . — S. 43–49 . — ISSN 1476-4687 . - doi : 10.1038/nature09906 .
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Cílené strategie a strategie na úrovni genomu k odhalení podpisů metylace těla genu v lidských buňkách  //  Nature Biotechnology. — 2009-04. — Sv. 27 , iss. 4 . — S. 361–368 . — ISSN 1546-1696 . - doi : 10.1038/nbt.1533 .
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Genomové methylační mapy DNA pluripotentních a diferencovaných buněk  (anglicky)  // Nature. — 2008-08. — Sv. 454 , iss. 7205 . — S. 766–770 . — ISSN 1476-4687 . - doi : 10.1038/nature07107 .
  30. Přesměrování . linkinghub.elsevier.com . Staženo: 10. listopadu 2020.
  31. Maher B. Boj o ENCODE a haraburdí . Novinky Blog . Nakladatelství Nature (6. září 2012).
  32. Kolata G. Daleko od „nezdravého odpadu“, DNA Dark Matter se ukazuje jako zásadní pro zdraví , The New York Times (5. září 2012).
  33. Gregory TR. Mediální humbuk ENCODE stroj . Genomicron (6. září 2012).
  34. Graur D., Zheng Y., Price N., Azevedo RB, Zufall RA, Elhaik E. O nesmrtelnosti televizních přijímačů: „funkce“ v lidském genomu podle evolučního evangelia  ENCODE  / / Genome Biol Evol : deník. - 2013. - Sv. 5 , č. 3 . - S. 578-590 . - doi : 10.1093/gbe/evt028 . — PMID 23431001 .
  35. Moran L.A. Sandwalk: O významu slova "Funkce" . Sandwalk (15. března 2013).
  36. Gregory TR. Kritika ENCODE v recenzovaných časopisech. "Genomicron (odkaz není k dispozici) . Genomicron (11. dubna 2013). Získáno 30. dubna 2015. Archivováno z originálu 2. dubna 2015. 
  37. White MA, Myers CA, Corbo JC, Cohen BA Masivně paralelní test zesilovače in vivo odhaluje, že vysoce lokální vlastnosti určují cis-regulační funkci vrcholů ChIP-seq   // Sborník Národní akademie věd Spojených států amerických  : časopis. - 2013. - Červenec ( roč. 110 , č. 29 ). - S. 11952-11957 . - doi : 10.1073/pnas.1307449110 . — PMID 23818646 .
  38. Mattick JS, Dinger ME Rozsah funkčnosti v lidském genomu  (neurčitý)  // The HUGO Journal. - 2013. - T. 7 , č. 1 . - S. 2 . - doi : 10.1186/1877-6566-7-2 .
  39. Příroda úvodník. Forma a funkce   // Příroda . - 2013. - 14. března ( sv. 495 ). - S. 141-142 . - doi : 10.1038/495141b .
  40. Birney, Ewan KÓDOVAT: Moje vlastní myšlenky . Ewanův blog: Bioinformatik na svobodě (5. září 2012).
  41. Timpson T. Debatující ENCODE: Dan Graur, Michael Eisen . Mendelspod (5. března 2013).
  42. Projekt modENCODE: ENCyklopedie prvků DNA modelového organismu (modENCODE) . webové stránky NHGRI . Staženo 13. listopadu 2008.
  43. Účastníci a projekty modENCODE . webové stránky NHGRI . Staženo 13. listopadu 2008.
  44. Berkeley Lab Life Sciences získal granty NIH za ovocné mušky, studie háďátek . Web Lawrence Berkeley National Laboratory (14. května 2007). Staženo 13. listopadu 2008.
  45. modENCODE . Národní institut pro výzkum lidského genomu.
  46. Celniker S. Odhalení tajemství genomu . Příroda (11. června 2009).
  47. Faktorová kniha
  48. Wang J. Factorbook.org: databáze založená na Wiki pro data vázající transkripční faktor generovaná konsorciem ENCODE . Výzkum nukleových kyselin (29. listopadu 2012).

Odkazy