Proteinová rodina

Rodina proteinů je skupina evolučně příbuzných proteinů , které sdílejí homologní aminokyselinovou sekvenci. Tento termín je téměř synonymem termínu „genová rodina“, protože pokud mají proteiny homologní aminokyselinové sekvence, pak geny , které je kódují, musí také vykazovat významný stupeň homologie v nukleotidových sekvencích DNA . Tento termín by neměl být zaměňován s termínem " rodina " v taxonomii druhů živých organismů .

Použití terminologie

Stejně jako u mnoha jiných biologických termínů je použití rodiny proteinů vysoce závislé na kontextu: může se týkat velké skupiny proteinů s jemnou primární sekvenční homologií nebo velmi úzké skupiny proteinů s téměř stejnou primární strukturou, funkcí a trojrozměrná organizace nebo jakýkoli jiný mezipřípad. Pro rozlišení těchto dvou extrémních situací zavedl Dyhoff koncept proteinové nadrodiny [1] [2] [3] . Postupem času byly vytvořeny pojmy jako třída , skupina , klan a podrodina , ale všechny utrpěly stejný nejednoznačný osud. V běžném používání se nadrodinou (strukturální homologie) rozumí, že obsahuje rodiny (homologie primární sekvence), které obsahují podrodiny. Proto má nadrodina, jako je klan PA proteázy, nižší úroveň konzervovaných sekvencí než jedna z jejích členských rodin, jako je rodina C04. Zdá se nepravděpodobné, že by se v blízké budoucnosti objevila přesná definice s jasnými kritérii, a proto se čtenář bude muset sám rozhodnout, jak přesně tyto pojmy v každém konkrétním kontextu chápat.

Proteinové domény a motivy

Koncept rodiny proteinů vznikl v době, kdy ještě existovalo velmi málo proteinů se známou primární a terciární strukturou; byly zkoumány hlavně malé proteiny s jednou doménou, jako je myoglobin , hemoglobin a cytochrom c . Od té doby bylo zjištěno, že mnoho proteinů obsahuje mnoho strukturně a funkčně nezávislých jednotek nebo domén . Díky rekombinaci genů, ke které došlo během evoluce, se různé domény vyvinuly nezávisle. Z tohoto důvodu se v posledních letech stále více pozornosti věnuje rodinám proteinových domén. Definování a katalogizaci takových domén je věnována řada online zdrojů (viz seznam na konci článku).

Části každého proteinu mají různá strukturální omezení (tj. strukturální rysy nezbytné k udržení struktury a funkce proteinu). Například pro fungování aktivního místa enzymu je nutné, aby určité aminokyselinové zbytky byly vzájemně velmi přesně umístěny v trojrozměrném prostoru. Na druhé straně k interakci protein-protein může docházet na velkém povrchu a může být omezena hydrofobicitou nebo hydrofilitou aminokyselin. Funkčně důležité části proteinů se vyvíjejí pomaleji než nekonzervované oblasti, jako jsou povrchové smyčky, a dávají vzniknout blokům konzervovaných sekvencí. Takové bloky se obvykle nazývají motivy . Stejně jako v předchozím případě je jejich definici a katalogizaci věnována řada online zdrojů.

Evoluce proteinových rodin

Podle současných představ lze rodiny proteinů tvořit dvěma způsoby. V prvním případě je rodičovský druh rozdělen do dvou geneticky izolovaných potomků, což umožňuje genu/proteinu nezávisle akumulovat variace ( mutace ) v těchto dvou liniích. V důsledku toho se vytvoří rodina ortologních proteinů, které mají obvykle společný konzervovaný motiv. Druhým způsobem je genová duplikace a vzhled paralogu . Protože první kopie genu je stále schopna plnit svou funkci, duplikát se může volně měnit a získávat nové funkce (prostřednictvím náhodných mutací). Některé rodiny genů/proteinů, zejména u eukaryot , procházejí během evoluce významným kopírováním nebo redukcí, někdy spolu se zdvojnásobením celého genomu.

Význam proteinových rodin

Se zvyšujícím se celkovým počtem proteinů se známou strukturou a se zvyšujícím se zájmem o proteomickou analýzu se objevují pokusy uspořádat proteiny do rodin a popsat jejich domény a motivy. Spolehlivá identifikace proteinových rodin je zásadní pro fylogenetickou analýzu, stanovení funkce proteinu a studium mnohosti proteinových funkcí v dané fylogenetické skupině. Enzyme Function Initiative (EFI) využívá proteinové rodiny a superrodiny jako základ pro vytvoření strategie pro rozsáhlou taxonomickou distribuci enzymů neznámé funkce [4] .

Algoritmické prostředky pro stanovení rodiny proteinů jsou založeny na konceptu podobnosti. Většinu času je jedinou podobností, ke které máme přístup, homologie primární struktury.

Zdroje pro rodiny proteinů

Existuje mnoho biologických databází věnovaných rodinám proteinů, které umožňují rychle určit, zda nově objevený a identifikovaný protein patří do již známé rodiny proteinů. Zejména:

Pfam
PROSITE
Interpro
PASS2 [5]
NADRODINĚ
SCOP a CATH - klasifikace proteinů podle rodin, superrodin a domén

Existují také specializované vyhledávače:

BLAST - vyhledávání podle sekvencí DNA
BLASTp - hledání proteinové sekvence

Viz také

Poznámky

↑ Dayhoff MO Počítačová analýza proteinových sekvencí. (anglicky) // jednání federace. - 1974. - Sv. 33, č. 12 . - S. 2314-2316. — PMID 4435228 .
↑ Dayhoff MO , McLaughlin PJ , Barker WC , Hunt LT Evoluce sekvencí v proteinových superrodinách // Die Naturwissenschaften. - 1975. - Duben ( roč. 62 , č. 4 ). - S. 154-161 . — ISSN 0028-1042 . - doi : 10.1007/BF00608697 .
↑ Dayhoff MO Původ a vývoj proteinových superrodin. (anglicky) // jednání federace. - 1976. - Sv. 35, č. 10 . - S. 2132-2138. — PMID 181273 .
↑ Gerlt John A. , Allen Karen N. , Almo Steven C. , Armstrong Richard N. , Babbitt Patricia C. , Cronan John E. , Dunaway-Mariano Debra , Imker Heidi J. , Jacobson Matthew P. , Minor Wladek , Poulter C. Dale , Raushel Frank M. , Sali Andrej , Shoichet Brian K. , Sweedler Jonathan V. The Enzyme Function Initiative // Biochemie. - 2011. - 22. listopadu ( roč. 50 , č. 46 ). - S. 9950-9962 . — ISSN 0006-2960 . doi : 10.1021 / bi201312u .
↑ Gandhimathi A. , Nair AG , Sowdhamini R. PASS2 verze 4: aktualizace databáze strukturně založených sekvenčních zarovnání superrodin strukturních domén. (anglicky) // Výzkum nukleových kyselin. - 2012. - Sv. 40.-P. D531-534. doi : 10.1093 / nar/gkr1096 . — PMID 22123743 .