Lidský genom je souhrn dědičného materiálu obsaženého v lidské buňce [1] . Podle této definice se lidský genom skládá z 23 párů chromozomů umístěných v jádře a také z mnoha kopií mitochondriální DNA . Existuje další definice genomu, ve které genom znamená souhrn genetického materiálu haploidní sady chromozomů [2] [3] . Když mluvíme o velikosti lidského genomu, mají na mysli tuto verzi definice genomu. Takže dvacet dva autozomů , dva pohlavní chromozomyX a Y, stejně jako lidská mitochondriální DNA, společně obsahují 3 099 734 149 párů bází [4] . Do roku 2003 bylo sekvenováno 85 % lidského genomu a úplné sekvenování lidského genomu bylo dokončeno až v roce 2022 [5] .
Během realizace projektu Human Genome Project byla stanovena DNA sekvence všech chromozomů a mitochondriální DNA . V současné době jsou tato data aktivně využívána po celém světě v biomedicínském výzkumu. Celé sekvenování odhalilo, že lidský genom obsahuje 19 969 aktivních genů , což je jen velmi malá část genomu, pouze 1,5 % z celkového genetického materiálu kóduje proteiny nebo funkční RNA . [4] Existuje celkem 63 494 genů, z nichž většinu tvoří nekódující geny RNA, často označované jako nevyžádaná DNA [6] , ale bylo zjištěno, že hrají důležitou roli v regulaci aktivity genů [7] [ 8] .
Hlavní část genomu (92 %) byla dešifrována do roku 2003 v rámci projektu Human Genome Project. V dubnu 2022 bylo oznámeno, že mezinárodní tým výzkumníků sekvenoval posledních 8 % lidského genomu [9] .
V genomu je 23 párů chromozomů : 22 párů autozomálních chromozomů a také pár pohlavních chromozomů X a Y. U lidí je mužské pohlaví heterogametické a je určeno přítomností chromozomu Y. Normální diploidní somatické buňky mají 46 chromozomů [10] [11] .
Předběžné odhady naznačovaly přítomnost více než 100 000 genů v lidském genomu. Podle výsledků Human Genome Project byl počet genů, nebo spíše otevřených čtecích rámců , asi 23 000 genů. V souvislosti se zdokonalováním metod vyhledávání (předpovídání) genů se očekává další snižování počtu genů.
Počet genů u lidí je jen o málo větší než u jednodušších organismů , jako je škrkavka Caenorhabditis elegans nebo moucha Drosophila melanogaster . To je způsobeno skutečností, že alternativní sestřih je široce zastoupen v lidském genomu . Alternativní sestřih vám umožňuje získat několik různých proteinových řetězců z jednoho genu. V důsledku toho je lidský proteom mnohem větší než proteom uvažovaných organismů. Většina lidských genů má více exonů a introny jsou často výrazně delší než hraniční exony v genu.
Geny jsou v chromozomech rozmístěny nerovnoměrně. Každý chromozom obsahuje oblasti bohaté a chudé na geny. Tyto oblasti korelují s chromozomálními pásy (pásy napříč chromozomem, které jsou viditelné pod mikroskopem) as oblastmi bohatými na CG . V současné době není význam této nerovnoměrné distribuce genů zcela pochopen.
Kromě genů kódujících protein obsahuje lidský genom tisíce genů RNA , které kódují přenosové RNA (tRNA), ribozomální RNA , mikroRNA a další RNA nekódující proteiny.
V lidském genomu bylo nalezeno mnoho různých sekvencí, které jsou zodpovědné za genovou regulaci . Regulace se týká kontroly genové exprese (proces budování messenger RNA podél části molekuly DNA). Obvykle se jedná o krátké sekvence, které buď sousedí s genem, nebo uvnitř genu. Někdy jsou ve značné vzdálenosti od genu ( enhancery ). Systemizace těchto sekvencí, pochopení mechanismů práce, jakož i otázky vzájemné regulace skupiny genů skupinou odpovídajících enzymů jsou zatím pouze v počáteční fázi studia. Vzájemná regulace skupin genů je popsána pomocí genových regulačních sítí . Studium těchto problémů je na průsečíku několika oborů: aplikované matematiky , vysoce výkonných počítačů a molekulární biologie . Poznatky pocházejí ze srovnání genomů různých organismů a z pokroků v umělé genové transkripci v laboratoři.
Identifikace regulačních sekvencí v lidském genomu byla částečně provedena na základě evolučního konzervatismu (vlastnost zachování důležitých fragmentů chromozomální sekvence, které plní zhruba stejnou funkci). Podle údajů z molekulárních hodin se lidské a myší evoluční linie rozdělily asi před 100 miliony let [12] . U dvou genomů počítačové metody odhalily konzervativní sekvence (sekvence, které jsou ve srovnávaných genomech shodné nebo velmi mírně odlišné) v nekódující části a ukázalo se, že se aktivně podílejí na mechanismech genové regulace v obou organismech [13] .
Další přístup k získání regulačních sekvencí je založen na srovnání genů člověka a ryb . Sekvence genů a regulačních sekvencí u lidí a pufferfish jsou významně podobné, nicméně genom pufferfish obsahuje 8x menší množství "junk DNA" . Tato „kompaktnost“ rybího genomu výrazně usnadňuje hledání regulačních sekvencí pro geny [14] .
Sekvence kódující protein (mnoho sekvencí, které tvoří exony ) tvoří méně než 1,5 % genomu [6] . Když pomineme známé regulační sekvence, lidský genom obsahuje řadu objektů, které vypadají jako něco důležitého, ale jejichž funkce, pokud vůbec nějaká, nebyla dosud objasněna. Tyto objekty zabírají až 97 % celkového objemu lidského genomu. Mezi tyto objekty patří:
Odpovídající sekvence jsou s největší pravděpodobností evoluční artefakt. V moderní verzi genomu je jejich funkce vypnutá a mnoho lidí tyto části genomu nazývá junk DNA. Existuje však mnoho důkazů, že tyto objekty mají nějakou funkci, která je stále nejasná.
PseudogenesExperimenty s DNA microarrays ukázaly, že do procesu transkripce je zapojeno mnoho negenových oblastí genomu [15] .
Asi 1% lidského genomu je obsazeno vestavěnými retrovirovými geny ( endogenními retroviry). Tyto geny obvykle hostiteli neprospívají, ale existují výjimky. Takže asi před 43 miliony let se retrovirové geny, které sloužily ke stavbě obalu viru, dostaly do genomu předků opic a lidí. U lidí a opic se tyto geny podílejí na práci placenty [16] . Většina retrovirů se integrovala do genomu lidských předků před více než 25 miliony let. Mezi mladšími lidskými endogenními retroviry nebyly dosud nalezeny žádné užitečné [17] [18] .
Dusíkaté báze v DNA ( adenin , thymin , guanin , cytosin ) odpovídají 4 různým logickým stavům, což odpovídá 2 bitům informace [19] . Lidský genom tedy obsahuje více než 6 gigabitů informací v každém řetězci, což odpovídá 800 megabytům a je srovnatelné s množstvím informací na CD [20] . Logika ukládání dat ve spárovaných základnách je podobná systému replikace (duplikace) dat RAID 1 .
Slovníky a encyklopedie | |
---|---|
V bibliografických katalozích |
Personalizovaná medicína | |
---|---|
Datové sekce Omix | |
Aplikační sekce | |
Metody | |
Související články |
lidské chromozomy | |
---|---|
autozomy | |
gonozomy |
Chromozomy | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Hlavní | |||||||||||
Klasifikace | |||||||||||
Struktura |
| ||||||||||
Restrukturalizace a porušení | |||||||||||
Určení chromozomálního pohlaví | |||||||||||
Metody |
Genetika | ||
---|---|---|
Klíčové koncepty | ||
Obory genetiky | ||
vzory | ||
související témata |