Výpočetní genomika

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 26. června 2013; kontroly vyžadují 6 úprav .

Výpočetní genomika používá výpočetní analýzu k dešifrování sekvencí genomu a souvisejících dat [1] , včetně sekvencí DNA a RNA . Počítačovou genomiku lze také definovat jako odvětví bioinformatiky , ale s tím rozdílem, že pozornost je věnována analýze kompletních genomů (spíše než jednotlivých genů), aby bylo možné pochopit principy toho, jak různé DNA řídí organismus na molekulární úrovni. [2] .

Historie

Výpočetní genomika začala svůj rozvoj současně s bioinformatikou. V 60. letech vytvořila Margaret Dayhoffová a další z National Biomedical Research Foundation databáze různých proteinových sekvencí pro evoluční výzkum [3] . Jejich studie vytvořila fylogenetický strom, který určoval změny potřebné k tomu, aby se určitý protein vyvinul v jiný protein. To vedlo k vytvoření substituční matice, která vyhodnocuje pravděpodobnost vazby jednoho proteinu na jiný.

Počínaje 80. lety 20. století začaly vznikat databáze sekvencí genomu, ale objevily se nové výzvy při hledání a porovnávání dat o jednotlivých genech. Na rozdíl od textových vyhledávacích algoritmů, které se používají na webových stránkách, je při hledání genetické podobnosti nutné identifikovat sekvence, které nemusí být nutně identické, ale jednoduše podobné. To vedlo ke vzniku Needleman-Wunschova algoritmu , což je dynamický programovací algoritmus pro vzájemné porovnávání sad aminokyselinových sekvencí pomocí substitučních matic získaných v dřívější studii M. Deyhoffa. Později se objevil algoritmus BLAST , který umožňuje rychlé a optimalizované vyhledávání v databázích genových sekvencí. BLAST a jeho modifikace patří mezi nejpoužívanější algoritmy pro tento účel [4] .

Vznik slovního spojení „computational genomics“ se shoduje se vznikem kompletních anotovaných genomů v druhé polovině 90. let. První výroční konferenci o výpočetní genomice uspořádali vědci z Institutu pro výzkum genomu (TIGR) v roce 1998 a poskytli fórum pro tuto specializaci a účinně odlišili tuto oblast vědy od obecnějších oblastí genomiky nebo výpočetní biologie [5] [ 6] . Poprvé ve vědecké literatuře byl tento termín podle MEDLINE použit o rok dříve (v časopise Nucleic Acids Research [7] ).

Poznámky

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics at MIT (odkaz není dostupný) . Získáno 13. prosince 2010. Archivováno z originálu dne 22. března 2018. 
  3. David Mount (2000), Bioinformatika, sekvenční a genomová analýza, s. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T. A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004// article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Archivováno 7. ledna 2017 na Wayback Machine The 7th Annual Conference on Computational Genomics (2004)
  6. 9. výroční konference o počítačové genomice (2006) archivována 12. února 2007.
  7. A. Wagner (1997), Počítačový genomický přístup k identifikaci genových sítí, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048