UGENE

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 14. července 2019; kontroly vyžadují 15 úprav .
UGENE
Typ Bioinformatický program
Vývojář Unipro
Zapsáno v C++ , Qt
Operační systém Multiplatformní software
Jazyky rozhraní ruština , angličtina
Nejnovější verze 43 (21. srpna 2022)
Čitelné formáty souborů Proteinová databanka
Licence GPL
webová stránka ugene.net

UGENE  je bezplatný bioinformatický software . [jeden]

UGENE lze spustit na osobním počítači se systémem Windows , Mac OS X nebo Linux .

UGENE poskytuje grafické rozhraní pro práci se sekvencemi, anotacemi, vícenásobným zarovnáním , fylogenetickými stromy , sekvenačními daty ( NGS ) a dalšími. Data mohou být uložena jak lokálně (na osobním počítači), tak ve sdíleném úložišti (v laboratorní databázi).

UGENE zahrnuje desítky populárních bioinformatických algoritmů a nástrojů, stejně jako vlastní vývoj pro práci s těmito daty v kontextu genomiky , evoluční biologie , virologie a dalších oborů. Pro všechny nástroje je k dispozici také grafické rozhraní , které biologům bez zkušeností s programováním usnadňuje analýzu těchto dat.

UGENE poskytuje možnost streamovat analýzu velkého množství dat pomocí „Computational Circuit Designer“. Výpočetní obvod je v tomto případě složen z různých bloků: čtení dat, aplikace vestavěných algoritmů/nástrojů, záznam dat. V případě potřeby lze do schématu přidat bloky libovolných nástrojů příkazového řádku, bloky skriptů atd. Návrhář má připravené příklady schémat (pro anotaci sekvencí, převod formátů, analýzu sekvenačních dat a další).

Kromě GUI poskytuje UGENE rozhraní příkazového řádku . Výpočetní schéma sestavené v návrháři lze také spustit z příkazového řádku.

Pro zajištění maximálního výpočetního výkonu využívá UGENE výkon vícejádrových CPU a GPU k optimalizaci určitých výpočetních úloh.

Klíčové vlastnosti

Níže jsou uvedeny hlavní vlastnosti produktu:

Sekvenční editor

Sekvenční editor (“Sequence View”) umožňuje zobrazovat, analyzovat a upravovat nukleotidové nebo aminokyselinové sekvence. Pro různé typy dat jsou také podporovány další možnosti vizualizace v okně editoru sekvencí:

Editor vícenásobného zarovnání

Editor vícenásobného zarovnání („Editor zarovnání“) vám umožňuje pracovat s více nukleotidy nebo aminokyselinami – zarovnávat je, ručně upravovat, analyzovat, ukládat konsensus, vytvářet fylogenetické stromy atd.

Editor fylogenetických stromů

Prohlížeč fylogenetických stromů umožňuje zobrazovat a upravovat fylogenetické stromy. Je možné synchronizovat strom a vícenásobné zarovnání, na kterém je postaven.

Návrhář výpočetních obvodů UGENE

Návrhář výpočetního schématu umožňuje vytvářet a spouštět vícekroková výpočetní schémata. Charakteristickým rysem návrháře výpočetních schémat UGENE je, že schémata jsou spouštěna na lokálním počítači uživatele, což eliminuje režii nahrávání dat na server.

Každý obvod se skládá z výpočetních prvků. Návrhář obsahuje prvky pro většinu algoritmů integrovaných do UGENE. Je také možné vytvářet vlastní prvky, například na základě libovolného programu spouštěného z příkazové řádky. Výpočtové schéma lze uložit pro pozdější opětovné použití nebo pro přenos na jiného uživatele.

Vytvořené výpočetní schéma lze spustit pomocí grafického uživatelského rozhraní nebo rozhraní příkazového řádku . Grafické rozhraní poskytuje funkce pro sledování provádění obvodu: zobrazení výsledků, uložení parametrů, zobrazení chyb atd.

Vestavěná knihovna obsahuje hotová schémata pro převod, filtrování a anotaci dat. Ve spolupráci s NIH NIAID byla vyvinuta schémata pro analýzu dat NGS (hledání mutací, ChIP-seq , RNA-seq ).

Prohlížeč sestav

Assembly Browser začal v roce 2010 jako vstup do soutěže Illumina iDEA Challenge 2011 . Assembly Browser vám umožňuje vizualizovat a prozkoumat velká (až stovky milionů krátkých čtení) data sekvenování celého genomu . Podporované formáty: ACE, SAM a jeho binární verze BAM. Chcete-li zobrazit data v UGENE, vstupní soubor musí být převeden do nativního formátu UGENE. Tento přístup má výhody i nevýhody. Nevýhodou je doba konverze, která může být u velkých souborů značná, a velikost databází. Na druhou stranu vám převod umožňuje pohodlně zobrazit celou sestavu, procházet sestavou a rychle přejít do hustě pokrytých oblastí.

Podporované formáty biologických dat

Uvolňovací cyklus

Projekt vyvíjí společnost Unipro se sídlem v Akademgorodoku v Novosibirsku . Každá iterace trvá přibližně 1 až 2 měsíce, poté je vydána další verze. Uživatelé mají k dispozici také středně pokročilé sestavení .

Funkce, které budou zahrnuty v budoucích verzích, jsou do značné míry určeny požadavky uživatelů.

Ocenění

V roce 2010 byl UGENE [3] oceněn jako „Nejlepší bezplatný projekt v Rusku – 2010“ v kategorii „Skupinový projekt“ v soutěži časopisu Linux Format .

V roce 2010 se UGENE také umístila na třetím místě v „All-Russian každoroční soutěži projektů v oblasti vysoce výkonných počítačů (High Performance Computing)“ , podporované společnostmi Rosnano a Intel .

V roce 2008 získal projekt HMMER Algorithm Optimization Project společnosti UGENE první místo v soutěži PowerXCell 8i Processor Software Development Competition  (nedostupný odkaz) pořádané společností T-Platforms .

Literatura

  1. Okonečnikov, K.; Gološová, O.; Fursov, M.; tým UGENE. Unipro UGENE: unified bioinformatics toolkit  (neopr.)  // Bioinformatics. - 2012. - doi : 10.1093/bioinformatics/bts091 .
  2. Vaskin, Y.; Khomicheva, I.; Ignatieva, E.; Vityaev, E.;. Integrovaný systém ExpertDiscovery a UGENE pro inteligentní analýzu regulačních oblastí genů  (anglicky)  // In Silico Biology : journal. - 2012. - doi : 10.3233/ISB-2012-0448 .
  3. Vaskin, Yu.; Danilová, Yu.;. Svobodný duch bioinformatiky  (neopr.)  // Věda z první ruky. — 2013.

Podobný software

Odkazy