Výpočetní genomika používá výpočetní analýzu k dešifrování sekvencí genomu a souvisejících dat [1] , včetně sekvencí DNA a RNA . Počítačovou genomiku lze také definovat jako odvětví bioinformatiky , ale s tím rozdílem, že pozornost je věnována analýze kompletních genomů (spíše než jednotlivých genů), aby bylo možné pochopit principy toho, jak různé DNA řídí organismus na molekulární úrovni. [2] .
Výpočetní genomika začala svůj rozvoj současně s bioinformatikou. V 60. letech vytvořila Margaret Dayhoffová a další z National Biomedical Research Foundation databáze různých proteinových sekvencí pro evoluční výzkum [3] . Jejich studie vytvořila fylogenetický strom, který určoval změny potřebné k tomu, aby se určitý protein vyvinul v jiný protein. To vedlo k vytvoření substituční matice, která vyhodnocuje pravděpodobnost vazby jednoho proteinu na jiný.
Počínaje 80. lety 20. století začaly vznikat databáze sekvencí genomu, ale objevily se nové výzvy při hledání a porovnávání dat o jednotlivých genech. Na rozdíl od textových vyhledávacích algoritmů, které se používají na webových stránkách, je při hledání genetické podobnosti nutné identifikovat sekvence, které nemusí být nutně identické, ale jednoduše podobné. To vedlo ke vzniku Needleman-Wunschova algoritmu , což je dynamický programovací algoritmus pro vzájemné porovnávání sad aminokyselinových sekvencí pomocí substitučních matic získaných v dřívější studii M. Deyhoffa. Později se objevil algoritmus BLAST , který umožňuje rychlé a optimalizované vyhledávání v databázích genových sekvencí. BLAST a jeho modifikace patří mezi nejpoužívanější algoritmy pro tento účel [4] .
Vznik slovního spojení „computational genomics“ se shoduje se vznikem kompletních anotovaných genomů v druhé polovině 90. let. První výroční konferenci o výpočetní genomice uspořádali vědci z Institutu pro výzkum genomu (TIGR) v roce 1998 a poskytli fórum pro tuto specializaci a účinně odlišili tuto oblast vědy od obecnějších oblastí genomiky nebo výpočetní biologie [5] [ 6] . Poprvé ve vědecké literatuře byl tento termín podle MEDLINE použit o rok dříve (v časopise Nucleic Acids Research [7] ).