Mezinárodní projekt HapMap

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 26. listopadu 2016; kontroly vyžadují 12 úprav .

Mezinárodní projekt HapMap (vyslov „ HapMap “ [1] ; anglicky  HapMap [hæp.mæp] , zkratka anglického  Haplotype Map  – „mapa haplotypů“) je organizace, jejíž aktivity jsou zaměřeny na vývoj haplotypové mapy lidského genomu k popisu obecné vzorce dědičná genetická variabilita lidí. HapMap se používá k nalezení genetických variant, které ovlivňují zdraví, nemoci a reakce na léky a faktory životního prostředí. Informace získané v rámci výzkumného projektu jsou veřejně dostupné.

Mezinárodní projekt HapMap je spoluprací mezi výzkumníky z akademických center, neziskovými biomedicínskými výzkumnými skupinami a soukromými společnostmi v Kanadě , Číně , Japonsku , Nigérii , Spojeném království a Spojených státech amerických . Oficiálně byla zahájena na schůzce ve dnech 27. až 29. října 2002 a její dokončení se očekávalo přibližně tři roky. Zahrnoval dvě fáze; úplná data získaná během první fáze byla zveřejněna 27. října 2005. Analýza datového souboru fáze II byla zveřejněna v říjnu 2007. Soubor dat fáze III byl zveřejněn na jaře roku 2009.

Historie

Na rozdíl od vzácných Mendelových chorob hrají kombinace různých genů a prostředí roli ve vývoji a progresi běžných onemocnění (jako je cukrovka , rakovina , srdeční choroby , mrtvice , deprese a astma ) nebo v individuálních reakcích na farmakologické látky. K nalezení dědičných faktorů spojených s těmito nemocemi by bylo možné v zásadě získat kompletní genetickou sekvenci několika jedinců, někteří s nemocí a někteří bez, a pak hledat rozdíly mezi dvěma sadami genomů . V té době tento přístup nebyl proveditelný kvůli ceně úplného sekvenování genomu. Projekt HapMap nabízel zkratku.

Ačkoli libovolní dva nepříbuzní lidé sdílejí přibližně 99,5 % své sekvence DNA , jejich genomy se v určitých nukleotidových umístěních liší . Takové oblasti jsou známé jako jednonukleotidové polymorfismy (SNP) a každá z možných výsledných genových forem se nazývá alela . Projekt HapMap se zaměřuje pouze na běžné polymorfismy, kde se každá alela vyskytuje alespoň u 1 % populace.

Každý člověk má dvě kopie všech chromozomů , kromě pohlavních chromozomů u mužů . Pro každý SNP se kombinace alel u jedince nazývá genotyp . Genotypizace se týká zjištění, že osoba má genotyp na určitém místě. Projekt HapMap odebral vzorky 269 jedinců a vybral několik milionů dobře definovaných SNP a publikoval výsledky genotypizace jedinců pro tyto SNP.

Alely blízkých SNP na stejném chromozomu jsou korelovány. Totiž, pokud je známa alela jednoho SNP pro daného jedince, lze předpovědět i alely sousedních SNP. Je tomu tak proto, že každý SNP vznikl v evoluční historii jako jediná bodová mutace a poté přešel na chromozom obklopený jinými, dřívějšími, bodovými mutacemi. SNP, které jsou na chromozomu odděleny velkou vzdáleností, nemají tendenci velmi dobře korelovat, takže k rekombinaci dochází každou generaci a mísí se sekvence alel těchto dvou chromozomů. Sekvence sousedních alel na konkrétním chromozomu se nazývá haplotyp .

Chcete-li najít genetické faktory spojené s konkrétním onemocněním, můžete postupovat následovně. Nejprve je identifikována specifická oblast zájmu v genomu, možná z dřívějších studií dědičnosti. V této oblasti se vyhledá řádek atributu SNP z dat HapMap; to jsou SNP, které velmi dobře korelují se všemi ostatními SNP v regionu. Studiem alel znaku SNP u člověka bude tedy možné s vysokou pravděpodobností určit haplotyp jedince. Dále jednotně určuje genotyp těchto známek SNP u skupiny jedinců s tímto onemocněním a u skupiny zdravých lidí. Porovnáním těchto dvou skupin se určí pravděpodobné umístění a haplotypy, které se podílejí na onemocnění.

Použité vzorky

Haplotypy mají tendenci být distribuovány napříč populacemi, ale jejich frekvence se může značně lišit. Pro zahrnutí do HapMap byly vybrány čtyři populace: 30 dospělých Yorubů a obou rodičů z Ibadanu v Nigérii (YRI), 30 trojčat žijících v Utahu severoevropského a západoevropského původu (CEU), 44 nepříbuzných Japonců z Tokia v Japonsku ( JPT) a 45 nepříbuzných Číňanů z Pekingu , Čína (CHB). Zatímco haplotypy identifikované z těchto populací mohou být použity ke studiu řady dalších populací, další výzkum v současné době zkoumá proveditelnost zahrnutí dalších populací do projektu.

Všechny vzorky byly odebrány prostřednictvím procesu zapojení komunity s příslušným informovaným souhlasem. Proces zapojení komunity byl navržen tak, aby identifikoval kulturně specifické problémy a pokusil se na ně reagovat a umožnil zúčastněným komunitám přispívat ke konzistentnímu osvětlování a procesu vzorkování.

Ve třetí fázi bylo shromážděno 11 globálních rodokmenových skupin: ASW ( Afričané z jihozápadních Spojených států ); CEU (Utah se severoevropskými a západoevropskými předky ze sbírky CEPH); CHB ( lidé Han v Pekingu, Čína); CHD (Číňané z Denveru , Colorado ); GIH ( Gujaratis v Houstonu , Texas ); JPT ( japonština v Tokiu, Japonsko); LWK etnická skupina Luhya ve Webuye, Keňa ); MEX ( Mexičané v Los Angeles , Kalifornie ); MKK ( Maasai v Kenyawa, Keňa); TSI (Toskánci v Itálii ); YRI (Yoruba v Ibadanu, Nigérie). [2]

Byly také vytvořeny tři kombinované skupiny pro lepší identifikaci SNP ve skupinách nad rámec devíti homogenních vzorků: CEU+TSI (kombinovaná skupina Utahů se severoevropskými a západoevropskými předky ze sbírky CEPH a Joscan v Itálii); JPT+CHB (kombinovaný panel japonštiny v Tokiu, Japonsko a čínštiny Han v Pekingu, Čína) a JPT+CHB+CHD (společný panel japonštiny v Tokiu, Japonsko, čínštiny Han v Pekingu v Číně a čínštiny v Denveru, Colorado) . CEU+TSI je například lepší model britských jednotlivců než samotná CEU. [2]

Vědecká strategie

Pro fázi jedna byl genotypován jeden společný SNP každých 5000 bází. Celkově bylo genotypováno přes jeden milion SNP. Genotypizace byla provedena v 10 centrech pomocí pěti různých technologií. Kvalita genotypizace byla hodnocena pomocí duplicitních nebo spojených vzorků a za přítomnosti periodických kontrol kvality, kdy centra měla přístup k jednotlivým sadám genotypů SNP.

Kanadský tým pod vedením Thomase J. Hudsona z McGill University v Montrealu se zaměřil na chromozomy 2 a 4. Čínský tým vedený Huengming Yangem se středisky v Pekingu , Šanghaji a Hong Kongu se zabýval chromozomy 3, 8 a 21. Japonský tým vedený Yusukem Nakamurou na Tokijské univerzitě studoval chromozomy 5, 11, 14, 15, 16, 17 a 19. Britský tým vedený Davidem R. Bentleym z Sanger Institute a zaměřil se na chromozomy 1, 6, 10 , 13 a 20. Ve Spojených státech byla také čtyři genotypizační centra : tým vedený Markem Che a Arnoldem Oliphantem ze společnosti Illumina Inc. v San Diegu (studuje chromozomy 8q, 9, 18q, 22 a X), tým vedený Davidem Altschulerem z Cambridge Institute, USA (chromozomy 4q, 7q, 18 bodů, Y a mitochondrie ), tým vedený Richardem A. Gibbs na Baylor College of Medicine v Houstonu (12. chromozom) a tým vedený Puyi-Yan Kwokem z Kalifornské univerzity v San Franciscu (chromozom 7 bp).

Aby bylo možné získat dostatek SNP pro vytvoření mapy, muselo Konsorcium financovat velký projekt re-sekvencování, aby zpracoval miliony dalších SNP. Veřejnosti je představila databáze dbSNP. Výsledkem bylo, že v srpnu 2006 databáze zahrnovala více než deset milionů SNP a o více než 40 % z nich bylo známo, že jsou polymorfní. Pro srovnání, na začátku projektu byly identifikovány méně než 3 miliony polymorfismů a ne více než 10 % z nich bylo polymorfních.

Během druhé fáze bylo více než dva miliony dalších SNP genotypováno společností Perlegen Sciences a 500 000 pomocí Affymetrix.

Přístup k datům

Všechna data generovaná projektem, včetně SNP frekvencí, genotypů a haplotypů , byla zveřejněna a dostupná ke stažení. Tato webová stránka také obsahuje prohlížeč genomu, který vám umožňuje najít SNP v jakékoli oblasti zájmu, jejich alelové frekvence a jejich vztah k blízkým SNP. K dispozici je také nástroj, který může určit značku SNP pro danou oblast zájmu. K těmto datům lze také přímo přistupovat z široce používaného programu Haploview.

Kritika

Bylo tvrzeno[ kým? ] , že projekt HapMap se ve snaze ušetřit financování široce představil jako nástroj pro identifikaci běžných původců onemocnění. Stále více důkazů naznačuje, že data HapMap jsou mnohem užitečnější pro studium struktury populace než pro zamýšlený účel sledování struktury populace v genomových studiích. [3]

Publikace

Poznámky

  1. "...projekt HapMap byl založen, aby porovnal genetické sekvence různých jedinců a identifikoval segmenty chromozomů s běžnými genetickými variantami."  — Zpráva komise WHOVeřejné zdraví, inovace a práva duševního vlastnictví. Archivováno 29. listopadu 2016 na Wayback Machine , strana 36
  2. 1 2 Mezinárodní konsorcium HapMap a kol. (2010). Integrace běžných a vzácných genetických variací v různých lidských populacích. Příroda , 467 , 52-8. doi
  3. Terwilliger JD a Hiekkalinna T (2006). Naprosté vyvrácení 'Základní věty HapMap' Archivováno z originálu 20. srpna 2011. European Journal of Human Genetics 14 , 426–437 .

Externí odkazy