DataMelt

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 14. února 2019; kontroly vyžadují 13 úprav .
DataMelt
Vývojář S.V.Čekanov _
Zapsáno v Jáva
Operační systém Unix , Linux , OS X , Microsoft Windows
První vydání 2005 (původní název JHepWork)
Hardwarová platforma Java virtuální stroj
Nejnovější verze 2.4 (únor 2019)
Licence Open source (LGPL, GPL a podobně)
webová stránka jwork.org/dmelt/

DataMelt (nebo zkráceně DMelt ) je bezplatný program pro vědecké výpočty [1] [2] . DataMelt je interaktivní prostředí pro výpočty, analýzu a vizualizaci dat a strojové učení. Program DataMelt je určen pro vědce, inženýry a studenty. DataMelt je multiplatformní, protože je napsán v jazyce Java , takže běží na jakémkoli operačním systému, kde lze nainstalovat virtuální stroj Java. Program je určen pro statistickou analýzu dat, prokládání křivek, algoritmy analýzy dat, numerické výpočty, strojové učení a vykreslování ve 2D a 3D. DataMelt používá vysoké programovací jazyky jako Jython , JRuby . Java lze také použít k volání numerických a grafických knihoven DataMelt.

Historie vytvoření

DataMelt má svůj původ v částicové fyzice , kde je dolování dat primárním zájmem. Byl vytvořen jako projekt jHepWork v roce 2005 a byl původně napsán pro analýzu dat pro částicové fyziky v laboratoři DESY v Německu. Později byl vylepšen v Argonne National Laboratory pro výzkum částicové fyziky [3] pomocí softwarového konceptu Java pro projekt International Linear Collider , vyvinutý v SLAC . Pozdější verze jHepWork byly upraveny pro obecné použití (vědci, inženýři, studenti pro vzdělávací účely) od ukončení projektu International Linear Collider. V roce 2013 byl jHepWork přejmenován na DataMelt a stal se obecným projektem podporovaným komunitou. Hlavním referenčním zdrojem je kniha Analyzing Scientific Data Using Jython Scripting and Java. [4] , která pojednává o technikách analýzy dat pomocí skriptování v Javě a Jythonu . Později se o tom hovořilo také v německém Java magazínu SPEKTRUM. [5] . Řetězec "HEP" v názvu projektu "jHepWork" je zkratka pro "High Energy Physics". Ale kvůli jeho široké popularitě mimo tuto oblast fyziky byl přejmenován na SCaViS ( 'S' vědecké , 'C' výpočetní prostředí a 'Vis' uživatelské prostředí). Tento projekt trval 3 roky, než byl přejmenován na DataMelt (nebo zkráceně DMelt).

Podporované platformy

DataMelt běží na platformách Windows, Linux, Mac a Android . Balíček pro Android se nazývá AWork.

Recenze

DataMelt a jeho dřívější verze, SCaVis (2013-2015) a JHepWork (2005-2013), které jsou stále dostupné v archivním úložišti DataMelt , jsou popsány v těchto článcích: [6] [7] [8] [9] Program byl porovnáván s jinými podobnými programy v těchto zdrojích [10] [11] [12] .

DataMelt (2015-), je nový vývoj programů JHepWork a SCaVis. Tyto zdroje porovnávají DataMelt s jinými oblíbenými statistickými a numerickými analytickými balíčky. [13] [14] [15] [16] . Podle novějších recenzí online článků a blogů je DataMelt jedním z populárních programů pro analýzu dat [17] [18] . .

Ukázkový kód

Zde je příklad, jak zobrazit 2D histogramy čtením souboru CVS staženého z webu Světové banky .

z jhplot.io.csv import * z java.io import * z jhplot import * d = {} čtenář = CSVReader ( FileReader ( "ny.gdp.pcap.cd_Indicator_en_csv_v2.csv" )); while True : nextLine = čtenář . readNext () pokud nextLine je None : break xlen = len ( nextLine ) if xlen < 50 : continue d [ nextLine [ 0 ]] = float ( nextLine [ xlen - 2 ]) # key=country, value=DGP c1 = HChart ( "2013" , 800 , 400 ) #c1.setGTitle("Hrubý domácí produkt 2013 na hlavu") c1 . viditelné () c1 . setChartBar () c1 . setNameY ( "aktuální USD" ) c1 . setNameX ( "" ) c1 . setName ( "Hrubý domácí produkt na hlavu 2013" ) name1 = "Zdroj dat: World Development Indicators" set_value = název lambda : c1 . valueBar ( d [ název ], název , název1 ) set_value ( name = "Rusko" ) set_value ( name = "Polsko" ) set_value ( name = "Rumunsko" ) set_value ( name = "Bulharsko" ) set_value ( name = "Bělorusko" ) set_value ( name = "Ukrajina" ) c1 . aktualizovat ()

Po provedení tohoto skriptu se histogram zobrazí v samostatném okně. Obrázek lze uložit v několika formátech.

Zde je další jednoduchý příklad, který ilustruje, jak naplnit 2D pruhový graf a zobrazit jej na plátně. Skript také vytvoří tvar PDF . Tento skript ukazuje, jak slepit a smíchat nativní třídy Java (z balíčku java.util) a třídy DataMelt (z balíčku jhplot) uvnitř skriptu napsaného pomocí syntaxe Pythonu.

z java.util import Náhodný z jhplot import * c1 = HPlot3D ( "Canvas" ) # vytvořit interaktivní plátno c1 . setGTitle ( "Globální název" ) c1 . setNameX ( "X" ) c1 . setNameY ( "Y" ) c1 . viditelné () c1 . setAutoRange () h1 = H2D ( "2D histogram" , 25 , -3,0 , 3,0 , 25 , -3,0 , 3,0 ) rand = náhodné ( ) pro i v rozsahu ( 200 ) : h1 . fill ( rand . nextGaussian (), rand . nextGaussian ()) c1 . kreslit ( h1 ) c1 . export ( "jhplot3d.eps" ) # export do EPS vektorové grafiky

Tento skript lze spustit buď s DataMelt IDE, nebo se samostatným Jythonem po zadání cesty ke třídě pro knihovny DataMelt.

Poznámky

  1. Numerické výpočty a statistická analýza dat na platformě Java. S. V. Čekanov, Kniha. Springer, (2016) ISBN 978-3-319-28531-3 , 700 stran, [1] Archivováno 14. dubna 2019 na Wayback Machine
  2. DataMelt: bezplatné výpočetní a vizualizační prostředí. Autor: Moaaz Aldesoky. medevel.com. [2] Archivováno 9. srpna 2019 na Wayback Machine
  3. Analýza dat HEP pomocí jHepWork a Java, arXiv: 0809.0840v2, Předtisk ANL-HEP-CP-08-53. Předtisk CERN, arXiv: 0809.0840v2 Archivováno 19. listopadu 2018 na Wayback Machine
  4. Analýza vědeckých dat pomocí Jython Scripting a Java. Rezervovat. S. V. Chekanov (SVChekanov), Springer-Verlag, ISBN 978-1-84996-286-5 , [3] Archivováno 14. dubna 2019 na Wayback Machine
  5. ScaVis - Werkbank pro ty, kteří vyvíjejí aplikace pro Javu a Jython. Roe Klaus. JAVA SPEKTRUM. (v němčině), ročník 5 (2013) 26-28 [4] Archivováno 6. června 2019 na Wayback Machine
  6. Analýza dat a dolování dat pomocí Java, Jython a jHepWork Blog. 2010. Oracle.com. [5] Archivováno 6. června 2019 na Wayback Machine
  7. SCaVis - Werkbank für technisch-wissenschaftliche Berechnungen und Visualisierungen mit Java und Jython. od Rohe Klause. Java SPEKTRUM. (v němčině) ročník 5 (2013) 26-28 [6] Archivováno 6. června 2019 na Wayback Machine
  8. Analýza dat HEP pomocí jHepWork a Java. Sborník z workshopů HERA-LHC (2007-2008), DESY-CERN [7] Archivováno 19. listopadu 2018 na Wayback Machine
  9. Analýza vhodnosti nástrojů a metod pro dolování dat. [8] . S. Kováč, Bakalářská práce (anglicky), jHepWork je recenzován na str. 39-42, Masarykova univerzita.
  10. Recenze: Srovnávací studie různorodého sběru nástrojů pro dolování dat. Autor S. Sarumathi, N. Shanthi, S. Vidhya, M. Sharmila. International Journal of Computer, Control, Quantum and Information Engineering. 2014; 8(6). 7.
  11. Studie nástrojů, technik a trendů pro analýzu velkých dat. Autor R. Shireesha a kol. (2016) International Journal of Advance Computing Technique and Applications (IJACTA), ISSN : 2321-4546, Vol 4, Issue 1 [9] Archivováno 31. března 2019 na Wayback Machine
  12. Porovnání různých nástrojů pro dolování dat. Od P.Kaura atd. IJERT ISSN: 2278-0181 Sv. 3 Vydání 10 (2010) [10] Archivováno 8. května 2018 na Wayback Machine
  13. Srovnávací analýza technik extrakce informací pro dolování dat, Amit Verma et al. Indian Journal of Science and Technology, Vol 9, březen 2016 [11] Archivováno 20. července 2018 na Wayback Machine
  14. Stručný přehled vzdělávacích aplikací využívajících dolování dat a strojové učení, [12] Archivováno 8. května 2018 na Wayback Machine , od A. Berenice Urbina Nájera, Jorgede la Calleja Mora, Redie ISSN 1607-4041. Revista Electronica de Investigación Educativa, 19(4), 84-96
  15. Analýza dat pomocí nástroje pro dolování dat Orange. Maqsud S. Kukasvadiya et. al. [13] Archivováno 9. května 2018 na Wayback Machine (2017) IJEDR, svazek 5, vydání 2, ISSN: 2321-9939
  16. Big Data – Průzkum technologií Big Data. Autor P.Dhavalchandra, M.Jignasu, R.Amit. International Journal of Science and Technology. Volume 2, str. 45-50 (2016) [14] Archivováno 8. května 2018 na Wayback Machine
  17. Popularita softwarových programů pro datovou vědu pomocí nedávných recenzí, článek (září 2018), T.Smalzer (staženo v roce 2019), [15] Archivováno 29. července 2019 na Wayback Machine
  18. Hodnocení a porovnání softwarových sad s otevřeným zdrojovým kódem pro dolování dat a objevování znalostí, od Abdulrahmana H. Altalhiho, JM Luny, MA Vallejo, S. Ventury, Wires/Willey, DOI: 10.1002/widm.1204 (2017), [16] Archivováno 31. května 2019 na Wayback Machine

Odkazy