Centimorganide, centimorgan (zkráceně: cM) v genetice je jednotka měření genetické vazby mezi polymorfními fragmenty genomu ( lokusy nebo markery ), která je definována jako vzdálenost, ve které je pravděpodobnost rekombinace genu v meióze 1 %. Podmíněná vzdálenost zde není fyzická vzdálenost, i když koreluje se vzdáleností mezi fragmenty genomu podél řetězce DNA, vyjádřenou v počtu párů bází . Čím větší je vzdálenost v centimorganidech, tím menší je vazba segmentů DNA, tzn. pravděpodobněji překročí tyto regiony.
Název jednotce dal Alfred Henry Sturtevant na počest svého učitele Thomase Hunta Morgana [1] .
Počet párů bází, kterým centimorganid odpovídá, se v celém genomu značně liší – různé oblasti chromozomu mají různé sklony ke křížení . Toto číslo se navíc mezi různými biologickými druhy výrazně liší. V lidském těle tedy jeden centimorganid odpovídá přibližně jedné megabázi (jeden milion párů bází ) [2] [3] , zatímco malarické plazmodium Plasmodium falciparum má průměrnou rekombinační vzdálenost ~15 kilobází (kb) na centimorganid: markery jsou odděleny 15 kb DNA (15 kb ) , mají očekávanou míru křížení 1 % na generaci.
Průměrná rekombinační vzdálenost odpovídající 1 centimorganidu není stejná u mužů a žen. Bylo tedy vypočteno, že autozomální (tj. bez pohlavních chromozomů ) lidský genom u žen má celkovou délku 4782 cm a u mužů pouze 2809 cm [4] . To znamená, že k rekombinaci během tvorby ženských gamet u lidí dochází mnohem častěji než u mužských. U samců Drosophila (na rozdíl od samic) a samic bource morušového (na rozdíl od samců) nedochází ke cross-overu vůbec [5] , což odpovídá nulové vzdálenosti (kompletní genetické vazbě) mezi jakýmikoli geny v chromozomu.
Všimněte si, že nesyntetické geny (geny umístěné na různých chromozomech) jsou ze své podstaty oddělené a vzdálenosti CM se na ně nevztahují.
Vzhledem k tomu, že genetická rekombinace mezi dvěma markery je nalezena pouze tehdy, je-li mezi nimi lichý počet křížení, vzdálenost vyjádřená v centimorganech plně nekoreluje s pravděpodobností genetické rekombinace.
Vezmeme-li za model Haldaneovu mapovací funkci , kde počet křížení koreluje s Poissonovým rozdělením [6] , povede genetická vzdálenost d k lichému počtu křížení (a tedy k detekci genetické rekombinace) s pravděpodobnost P vypočtená podle vzorce:
kde sh je hyperbolická funkce sinus . Pravděpodobnost rekombinace je asi d /100 pro malé hodnoty d a dosahuje 50%, když d jde do nekonečna.
Tento vzorec lze obrátit a získat vzdálenost v centimorganech jako funkci pravděpodobnosti rekombinace: