DataMelt | |
---|---|
Vývojář | S.V.Čekanov _ |
Zapsáno v | Jáva |
Operační systém | Unix , Linux , OS X , Microsoft Windows |
První vydání | 2005 (původní název JHepWork) |
Hardwarová platforma | Java virtuální stroj |
Nejnovější verze | 2.4 (únor 2019) |
Licence | Open source (LGPL, GPL a podobně) |
webová stránka | jwork.org/dmelt/ |
DataMelt (nebo zkráceně DMelt ) je bezplatný program pro vědecké výpočty [1] [2] . DataMelt je interaktivní prostředí pro výpočty, analýzu a vizualizaci dat a strojové učení. Program DataMelt je určen pro vědce, inženýry a studenty. DataMelt je multiplatformní, protože je napsán v jazyce Java , takže běží na jakémkoli operačním systému, kde lze nainstalovat virtuální stroj Java. Program je určen pro statistickou analýzu dat, prokládání křivek, algoritmy analýzy dat, numerické výpočty, strojové učení a vykreslování ve 2D a 3D. DataMelt používá vysoké programovací jazyky jako Jython , JRuby . Java lze také použít k volání numerických a grafických knihoven DataMelt.
DataMelt má svůj původ v částicové fyzice , kde je dolování dat primárním zájmem. Byl vytvořen jako projekt jHepWork v roce 2005 a byl původně napsán pro analýzu dat pro částicové fyziky v laboratoři DESY v Německu. Později byl vylepšen v Argonne National Laboratory pro výzkum částicové fyziky [3] pomocí softwarového konceptu Java pro projekt International Linear Collider , vyvinutý v SLAC . Pozdější verze jHepWork byly upraveny pro obecné použití (vědci, inženýři, studenti pro vzdělávací účely) od ukončení projektu International Linear Collider. V roce 2013 byl jHepWork přejmenován na DataMelt a stal se obecným projektem podporovaným komunitou. Hlavním referenčním zdrojem je kniha Analyzing Scientific Data Using Jython Scripting and Java. [4] , která pojednává o technikách analýzy dat pomocí skriptování v Javě a Jythonu . Později se o tom hovořilo také v německém Java magazínu SPEKTRUM. [5] . Řetězec "HEP" v názvu projektu "jHepWork" je zkratka pro "High Energy Physics". Ale kvůli jeho široké popularitě mimo tuto oblast fyziky byl přejmenován na SCaViS ( 'S' vědecké , 'C' výpočetní prostředí a 'Vis' uživatelské prostředí). Tento projekt trval 3 roky, než byl přejmenován na DataMelt (nebo zkráceně DMelt).
DataMelt běží na platformách Windows, Linux, Mac a Android . Balíček pro Android se nazývá AWork.
DataMelt a jeho dřívější verze, SCaVis (2013-2015) a JHepWork (2005-2013), které jsou stále dostupné v archivním úložišti DataMelt , jsou popsány v těchto článcích: [6] [7] [8] [9] Program byl porovnáván s jinými podobnými programy v těchto zdrojích [10] [11] [12] .
DataMelt (2015-), je nový vývoj programů JHepWork a SCaVis. Tyto zdroje porovnávají DataMelt s jinými oblíbenými statistickými a numerickými analytickými balíčky. [13] [14] [15] [16] . Podle novějších recenzí online článků a blogů je DataMelt jedním z populárních programů pro analýzu dat [17] [18] . .
Zde je příklad, jak zobrazit 2D histogramy čtením souboru CVS staženého z webu Světové banky .
z jhplot.io.csv import * z java.io import * z jhplot import * d = {} čtenář = CSVReader ( FileReader ( "ny.gdp.pcap.cd_Indicator_en_csv_v2.csv" )); while True : nextLine = čtenář . readNext () pokud nextLine je None : break xlen = len ( nextLine ) if xlen < 50 : continue d [ nextLine [ 0 ]] = float ( nextLine [ xlen - 2 ]) # key=country, value=DGP c1 = HChart ( "2013" , 800 , 400 ) #c1.setGTitle("Hrubý domácí produkt 2013 na hlavu") c1 . viditelné () c1 . setChartBar () c1 . setNameY ( "aktuální USD" ) c1 . setNameX ( "" ) c1 . setName ( "Hrubý domácí produkt na hlavu 2013" ) name1 = "Zdroj dat: World Development Indicators" set_value = název lambda : c1 . valueBar ( d [ název ], název , název1 ) set_value ( name = "Rusko" ) set_value ( name = "Polsko" ) set_value ( name = "Rumunsko" ) set_value ( name = "Bulharsko" ) set_value ( name = "Bělorusko" ) set_value ( name = "Ukrajina" ) c1 . aktualizovat ()Po provedení tohoto skriptu se histogram zobrazí v samostatném okně. Obrázek lze uložit v několika formátech.
Zde je další jednoduchý příklad, který ilustruje, jak naplnit 2D pruhový graf a zobrazit jej na plátně. Skript také vytvoří tvar PDF . Tento skript ukazuje, jak slepit a smíchat nativní třídy Java (z balíčku java.util) a třídy DataMelt (z balíčku jhplot) uvnitř skriptu napsaného pomocí syntaxe Pythonu.
z java.util import Náhodný z jhplot import * c1 = HPlot3D ( "Canvas" ) # vytvořit interaktivní plátno c1 . setGTitle ( "Globální název" ) c1 . setNameX ( "X" ) c1 . setNameY ( "Y" ) c1 . viditelné () c1 . setAutoRange () h1 = H2D ( "2D histogram" , 25 , -3,0 , 3,0 , 25 , -3,0 , 3,0 ) rand = náhodné ( ) pro i v rozsahu ( 200 ) : h1 . fill ( rand . nextGaussian (), rand . nextGaussian ()) c1 . kreslit ( h1 ) c1 . export ( "jhplot3d.eps" ) # export do EPS vektorové grafikyTento skript lze spustit buď s DataMelt IDE, nebo se samostatným Jythonem po zadání cesty ke třídě pro knihovny DataMelt.
Matematický software | |
---|---|
Symbolické výpočty | |
Numerické výpočty |