Rosetta@home | |
---|---|
| |
Typ | Protein Structure Prediction , Volunteer Computing a Berkeley Open Infrastructure for Network Computing projekty [d] |
Vývojář | Bakerova laboratoř , University of Washington , Rosetta Commons |
Operační systém | Multiplatformní software |
První vydání | 6. října 2005 |
Hardwarová platforma | BOINC |
Nejnovější verze | Rosetta Mini: 3,71 [1] ( 20. ledna 2016 ) |
Stát | Aktivní |
Licence | Zdarma pro akademické a neziskové použití, proprietární licence dostupná pro komerční použití [2] |
webová stránka | boinc.bakerlab.org/roset… |
Mediální soubory na Wikimedia Commons |
Rosetta@home | |
---|---|
Plošina | BOINC |
Velikost stahování softwaru | 48 MB |
Velikost načtených dat úlohy | 2,5 MB |
Množství odeslaných dat úlohy | 6-150 kB |
Místo na disku | 130 MB |
Využité množství paměti | 255 MB |
GUI | tady je |
Průměrná doba výpočtu úkolu | 0,5 - 10 hodin (možná časová kontrola) |
Uzávěrka | 10 dní |
Schopnost používat GPU | Ne |
Mediální soubory na Wikimedia Commons |
Rosetta@Home je dobrovolnický počítačový projekt , jehož cílem je vyřešit jeden z největších problémů molekulární biologie – výpočet terciární struktury proteinů z jejich aminokyselinových sekvencí. Díky dokončenému Human Genome Project jsou známy aminokyselinové sekvence všech proteinů v lidském těle. Výzkum v rámci tohoto projektu také pomůže při navrhování nových, neexistujících proteinů. Zatímco velká část projektu se zaměřuje na základní výzkum ke zlepšení přesnosti a robustnosti proteomických metod, Rosetta@home také podporuje aplikovaný výzkum v boji proti chorobám, jako je rakovina , malárie , Alzheimerova choroba , antrax a další genetická a virová onemocnění [3] . Foldit je videohra od Rosetta@Home, která si klade za cíl dosáhnout cílů projektu pomocí crowdsourcingového přístupu.
Výsledky výpočtu Rosetta@Home nejsou přímo dostupné. Také nemůžete použít výsledky výpočtů vašeho vlastního počítače. [4] Používají se však pro velké množství vědeckých publikací. [5]
Rosetta je v podstatě počítačový program, jehož hlavními úkoly jsou:
Tento projekt využívá předpovědi a zpětnou vazbu k výsledkům ke zlepšení potenciálních vyhledávacích funkcí a algoritmů .
aplikace Rosetta@home a BOINC Distributed Computing Platform , dostupné pro operační systémy Windows, Linux a macOS; BOINC také běží na několika dalších, jako je FreeBSD. Účast na Rosetta@home vyžaduje centrální procesorovou jednotku (CPU) s taktovací frekvencí alespoň 500 MHz, 200 MB volného místa na disku, 512 MB fyzické paměti a připojení k internetu. Od 27. června 2020 je aktuální verze aplikace Rosetta Mini 4.20. Aktuální doporučená verze softwaru BOINC je 7.16.7. Standardní Hypertext Transfer Protocol (HTTP) (port 80) se používá pro komunikaci mezi klientem BOINC uživatele a servery Rosetta@home na University of Washington ; HTTPS (port 443) se používá při výměně hesel. Vzdálená a místní správa BOINC klienta využívá porty 31416 a 1043, které lze specificky odblokovat, pokud jsou za firewallem. Pracovní jednotky obsahující data o jednotlivých proteinech jsou distribuovány ze serverů umístěných v Baker Lab na University of Washington do dobrovolných počítačů, které pak vypočítají předpověď struktury pro přiřazený protein. Aby se zabránilo opakujícím se předpovědím struktury pro daný protein, každý pracovní blok je inicializován náhodným počtem semen. To dává každé předpovědi jedinečnou trajektorii sestupu skrz energetickou krajinu proteinu. Předpovědi proteinové struktury z Rosetta@home jsou přibližné hodnoty pro globální minimum v daném energetickém prostředí proteinu. Toto globální minimum představuje energeticky nejvýhodnější konformaci proteinu, tedy jeho nativní stav.
Hlavním rysem grafického uživatelského rozhraní (GUI) Rosetta@home je spořič obrazovky, který zobrazuje aktuální stav běžícího modulu během simulace skládání proteinů. Levý horní roh aktuální úvodní obrazovky ukazuje cílový protein při hledání struktury s nejnižší energií nabývající různých tvarů (konformací). Hned vpravo je struktura posledního přijatého. Pravý horní roh ukazuje nejnižší energetickou konformaci aktuálního rozvržení; níže je skutečná nebo nativní struktura proteinu, pokud již byla stanovena. Úvodní obrazovka obsahuje tři grafy. Poblíž středu je zobrazen graf pro termodynamickou volnou energii přijatého modelu, která kolísá podle změn přijatého modelu. Graf akceptované standardní odchylky modelu (RMSD), který měří, jak strukturálně podobný je přijatý model nativnímu modelu, je zobrazen vpravo. Napravo od grafu přijaté energie a pod grafem RMSD jsou výsledky těchto dvou funkcí použity k vykreslení energie versus RMSD, jak je model postupně zpřesňován.
Stejně jako všechny projekty BOINC běží Rosetta@home na pozadí na počítači uživatele a využívá napájení z nečinného počítače během nebo před přihlášením k účtu v operačním systému hostitele . Program uvolňuje prostředky z CPU, protože je potřebují jiné aplikace, což neovlivňuje normální používání počítače. Mnoho možností programu lze nastavit prostřednictvím nastavení uživatelského účtu, včetně: maximálního procenta zdrojů CPU, které může program použít (k řízení spotřeby energie nebo generování tepla z počítače běžícího na konstantní výkon), denní doby, kdy může program běžet a více jiných.
Rosetta, software, který běží na síti Rosetta@home, byl přepsán v C++, aby se usnadnil vývoj, než umožňovala jeho původní verze napsaná ve Fortranu. Tato nová verze je objektově orientovaná a byla vydána 8. února 2008. Vývoj kódu Rosetta provádí Rosetta Commons. Software je volně licencován pro akademickou obec a je k dispozici farmaceutickým společnostem za poplatek.
S rozšiřováním projektů sekvenování genomu mohou vědci odvodit aminokyselinovou sekvenci nebo primární strukturu mnoha proteinů, které plní funkce v buňce. Aby vědci lépe porozuměli funkci proteinu a pomohli při racionálním návrhu léků, potřebují znát trojrozměrnou terciární strukturu proteinu.
Trojrozměrné struktury proteinů se v současnosti určují experimentálně pomocí rentgenové krystalografie nebo nukleární magnetické rezonance (NMR) spektroskopie. Tento proces je pomalý (může trvat týdny nebo dokonce měsíce, než přijdete na to, jak krystalizovat protein poprvé) a nákladný (kolem 100 000 $ za protein). Bohužel rychlost, s jakou jsou nové sekvence objeveny, daleko převyšuje rychlost určování struktury – z více než 7 400 000 proteinových sekvencí dostupných v databázi neredukovaných (nr) proteinů Národního centra pro biotechnologické informace (NCBI) existuje méně než 52 000 trojrozměrných proteinů. proteinové struktury byly vyřešeny a umístěny do Protein Data Bank, hlavního úložiště strukturních informací o proteinech [6] . Jedním z hlavních cílů Rosetta@home je předpovídat proteinové struktury se stejnou přesností jako stávající metody, ale způsobem, který vyžaduje podstatně méně času a peněz. Rosetta@home také vyvíjí metody pro stanovení struktury a dokování membránových proteinů (např. receptory spřažené s G proteinem (GPCR)), které je extrémně obtížné analyzovat tradičními metodami, jako je rentgenová krystalografie a NMR spektroskopie, ale které představují většinu cílů pro moderní drogy.
Pokrok v predikci struktury proteinu se měří v rámci dvouletého experimentu Critical Assessment for Protein Structure Prediction (CASP), ve kterém se výzkumníci z celého světa snaží odvodit strukturu proteinu z aminokyselinové sekvence proteinu. Vysoce výkonné skupiny v tomto někdy kompetitivním experimentu jsou považovány za de facto standard pro to, co je stav techniky v predikci proteinové struktury. Rosetta, program, na kterém je založen Rosetta @ home, byl použit s CASP5 v roce 2002. V experimentu CASP6 z roku 2004 se Rosetta zapsala do historie tím, že jako první dosáhla ab initio predikce proteinové struktury s téměř atomovým rozlišením ve svém prezentovaném modelu pro cíl CASP T0281. Ab initio modelování je považováno za zvláště náročnou kategorii predikce struktury proteinu, protože nepoužívá informace ze strukturální homologie a musí se spoléhat na informace ze sekvenční homologie a modelování fyzikálních interakcí v rámci proteinu. Rosetta@home se v CASP používá od roku 2006, kde byl jedním z nejlepších prediktorů v každé kategorii strukturálních predikcí v CASP7. Tyto vysoce kvalitní předpovědi byly založeny na výpočetním výkonu poskytnutém dobrovolníky Rosetta@home. Zvyšující se výpočetní výkon umožňuje Rosetta@home vybrat více oblastí konformačního prostoru (možné tvary, které může protein nabývat), u kterých se podle Levinthalova paradoxu předpokládá, že porostou exponenciálně s délkou proteinu.
Rosetta@home se také používá v predikci protein-protein docking, která určuje strukturu více komplexních proteinů nebo kvartérní strukturu. Tento typ proteinové interakce ovlivňuje mnoho buněčných funkcí, včetně vazby antigen-protilátka a vazby enzym-inhibitor, stejně jako import a export buněk. Určení těchto interakcí je rozhodující pro vývoj léků. Rosetta se používá v experimentu Critical Interaction Prediction Evaluation (CAPRI), který hodnotí stav dokovacího pole proteinu, podobně jako CASP měří pokrok v predikci struktury proteinu. Výpočetní výkon poskytnutý dobrovolníky projektu Rosetta@home byl uváděn jako jeden z hlavních hnacích motorů výkonu Rosetta na CAPRI, kde její předpovědi dokování patřily k nejpřesnějším a nejkompletnějším.
Na začátku roku 2008 byla Rosetta použita k výpočetnímu návrhu proteinu s funkcí, která se dříve v přírodě nevyskytovala. To bylo částečně inspirováno zkrácením slavného článku z roku 2004, který původně popisoval výpočetní návrh proteinu se zlepšenou enzymatickou aktivitou oproti jeho přirozené formě. Výzkumný dokument z roku 2008 od skupiny Davida Bakera popisující, jak byl protein vyroben, ve kterém Rosetta@home odkazuje na výpočetní zdroje, které dal k dispozici, je důležitým důkazem koncepce této metody proteinového inženýrství. Tento typ proteinového designu může mít budoucí aplikace pro objevování léků, zelenou chemii a bioremediaci.
Komponenta softwarového balíku Rosetta, RosettaDesign, byla použita k přesné předpovědi, které oblasti amyloidogenních proteinů s největší pravděpodobností tvoří fibrily podobné amyloidu. Využitím hexapeptidů (fragmentů dlouhých šest aminokyselin) sledovaného proteinu a výběrem nejnižší energetické shody pro strukturu podobnou struktuře známého hexapeptidu tvořícího fibrily byla RosettaDesign schopna identifikovat peptidy s dvojnásobnou pravděpodobností tvorby fibril než náhodné proteiny. . Rosetta@home byla použita ve stejné studii k predikci struktur pro beta-amyloid, protein tvořící fibrily, o kterém se předpokládá, že způsobuje Alzheimerovu chorobu. Předběžné, ale dosud nepublikované výsledky byly získány pro proteiny vyvinuté společností Rosetta, které mohou zabránit tvorbě fibril, i když není známo, zda to může zabránit onemocnění.
Další složka Rosetta, RosettaDock, byla použita ve spojení s experimentálními metodami k modelování interakcí mezi třemi proteiny – letálním faktorem (LF), edémovým faktorem (EF) a ochranným antigenem (PA) – které tvoří antraxový toxin. Počítačový model přesně předpověděl dokování mezi LF a PA, což pomohlo určit, které domény příslušných proteinů jsou zapojeny do komplexu LF-PA. Toto porozumění bylo nakonec použito ve výzkumu, což vedlo ke zlepšení vakcín proti antraxu.
RosettaDock byl použit k modelování spojení mezi protilátkou (imunoglobulin G) a povrchovým proteinem exprimovaným herpes virem, herpes simplex virus 1 (HSV-1), který slouží k degradaci antivirové protilátky. Proteinový komplex předpovídaný RosettaDock úzce souhlasil s obzvláště obtížně dostupnými experimentálními modely, což vedlo vědce k závěru, že metoda dokování by mohla vyřešit některé problémy, které má rentgenová krystalografie při modelování rozhraní protein-protein.
Prostřednictvím výzkumu financovaného z grantu Bill & Melinda Gates ve výši 19,4 milionů dolarů. USA, Rosetta@home byla použita při vývoji mnoha možných vakcín proti viru lidské imunodeficience (HIV).
Ve výzkumu spojeném s iniciativou Great Challenges in Global Health byla Rosetta použita k výpočtovému vývoji nových naváděcích endonukleázových proteinů, které by mohly zabít Anopheles gambiae nebo jinak způsobit, že komár nebude schopen přenášet malárii. Schopnost specificky modelovat a měnit interakce protein-DNA, jako jsou ty naváděcí endonukleázy, dává výpočetním metodám proteinového inženýrství, jako je Rosetta, důležitou roli v genové terapii (která zahrnuje potenciální léčbu rakoviny).
Podle oficiálních statistik účastníků projektu Rosetta@Home [7] byl k říjnu 2011 počet aktivních účastníků 38 tisíc lidí [8] . V červenci 2017 měl projekt přibližně 300 000 aktivních uživatelů [9] .
Dobrovolné počítačové projekty | |
---|---|
Astronomie |
|
Biologie a medicína |
|
poznávací |
|
Podnebí |
|
Matematika |
|
Fyzické a technické |
|
Víceúčelový |
|
jiný |
|
Utility |
|