Hluboké učení4j

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 7. ledna 2020; kontroly vyžadují 2 úpravy .
hluboké učení4j
Typ Zpracování přirozeného jazyka , hluboké učení , počítačové vidění , umělá inteligence
Autor Adam Gibson , Chris Nicholson , Josh Patterson
Vývojář Rozličný
Zapsáno v Java , Scala , CUDA , C , C++ , Python , Clojure
Operační systém Linux , macOS , Windows , Android
Jazyky rozhraní Angličtina
Hardwarová platforma multiplatformní
Nejnovější verze
Stát aktivní
Licence Apache 2.0
webová stránka deeplearning4j.org

Deeplearning4j  je programovací knihovna Java používaná jako rámec pro hluboké učení [2] [3] [4] . Zahrnuje implementace Restricted Boltzmann Machine , Deep Web of Trust , Deep Autoencoder , Stacked Autoencoder s filtrováním šumu, Rekurzivní Tensor Neural Network , word2vec , doc2vec a GloVe . Tyto algoritmy jsou také zahrnuty v distribuovaných počítačových verzích knihovny integrované s architekturami Apache Hadoop a Spark [5] .

Jedná se o software s otevřeným zdrojovým kódem distribuovaný pod licencí Apache 2.0 [6] ; hlavními vývojáři je skupina strojového učení v San Franciscu vedená Adamem Gibsonem [7] [8] , komerční implementace podporují startup Skymind .

Technologie

Deeplearning4j je implementován v Javě a běží v prostředí, které je kompatibilní s Clojure a obsahuje rozhraní ( API ) pro jazyk Scala . Volitelná open source knihovna ND4J poskytuje výpočty na GPU s podporou CUDA [9] [10] . Kromě toho existují nástroje pro práci s knihovnou Python prostřednictvím frameworku Keras [11] .

Framework umožňuje kombinovat komponenty, kombinující běžné neuronové sítě s Boltzmannovými stroji, konvoluční neuronové sítě, autokodéry a rekurentní sítě do jednoho systému. Kromě toho jsou podporovány pokročilé vizualizační nástroje [12] . Trénink se provádí jak pomocí konvenčních vícevrstvých neuronových sítí, tak pro složité sítě , ve kterých je definován výpočetní graf [13] .

Distribuované výpočty

Učení v Deeplearning4j se provádí prostřednictvím clusterů. Neuronové sítě jsou trénovány v paralelních iteracích, proces je podporován architekturami Hadoop -YARN a Spark [7] [14] . Deeplearning4j se také integruje se základní architekturou CUDA pro čistě GPU operace a distribuci operací na GPU.

Vědecké výpočty pro JVM

Deeplearning4j obsahuje třídu pro práci s n - rozměrnými daty v knihovně ND4J . To usnadňuje výpočty pro vědecké úlohy v Javě a Scale, zatímco funkčnost je podobná jazyku NumPy pro Python . Použití těchto nástrojů umožňuje efektivně řešit problémy lineární algebry a maticových transformací v praktických aplikacích.

DataVec vektorizační knihovna pro strojové učení

Knihovna DataVec vektorizuje soubory v různých vstupních a výstupních formátech podobným způsobem jako MapReduce ; přičemž data jsou transformována do vektorové podoby. DataVec vektorizuje tabulkový formát CSV , obrázky, zvuky, texty, videa a časové sekvence dat [15] [16] .

Přirozený jazyk a zpracování textu

Ke zpracování velkých objemů textů pomocí výkonu paralelních GPU používá Deeplearning4j nástroje pro vektorové a tématické modelování v Javě .

Knihovna obsahuje implementace frekvenční inverze ( TF-IDF ), hlubokého učení , algoritmu word2vec [17] Mikolov [17] , doc2vec a GloVe, které jsou optimalizovány v Javě. To využívá principu stochastického vkládání sousedů se Studentovou distribucí ( t-SNE ) k implementaci word cloudu.

Zabezpečení

Knihovna zahrnuje ochranu proti vnějšímu rušení a zabezpečení proti hackování, což je důležité zejména ve finančních úkolech [18] [19] , v průmyslových systémech, v e-commerce a podnikání se využívá rozpoznávání anomálií [20] a rozpoznávání vzorů [21] . Deeplearning4j je integrován s dalšími platformami strojového učení, jako jsou RapidMiner, Prediction.io [22] a Weka [23] .

Benchmarky

Porovnání výkonu ukazuje, že Deeplearning4j je srovnatelný s Caffe v netriviálních úlohách rozpoznávání vzorů zahrnujících paralelní GPU [24] . Pro programátory , kteří neznají JVM HPC , existuje několik parametrů, které lze upravit, aby se zlepšil výkon trénování neuronové sítě. Tyto možnosti zahrnují dynamické ladění paměti, algoritmus garbage collection , stránkování paměti a předběžné ukládání dat pro urychlení ETL [25] . Kombinací těchto nastavení můžete zvýšit výkon Deeplearning4j až desetkrát.

Viz také

Poznámky

  1. Vydání 0.9.1 – 2017.
  2. Metz, Cade Mise přinést AI Google do zbytku světa . Wired.com (2. června 2014). Získáno 28. června 2014. Archivováno z originálu 5. července 2020.
  3. Vance, Ashlee Hluboké učení pro (některé) lidi . Bloomberg Businessweek (3. června 2014). Datum přístupu: 28. června 2014. Archivováno z originálu 25. června 2014.
  4. Novet, Jordánsko Chcete open-source rámec pro hluboké učení? Vyber si . Venture Beat (14. listopadu 2015). Získáno 24. listopadu 2015. Archivováno z originálu 18. prosince 2019.
  5. TV, Functional Adam Gibson, DeepLearning4j na Spark a Data Science na JVM s nd4j, SF Spark @Galvanize 20150212 . SF Spark Meetup (12. února 2015). Získáno 1. března 2015. Archivováno z originálu 26. prosince 2015.
  6. Repozitář Github . Získáno 25. července 2017. Archivováno z originálu 24. září 2019.
  7. 1 2 deeplearning4j.org . Získáno 25. července 2017. Archivováno z originálu 30. března 2016.
  8. Profil Crunchbase . Získáno 25. července 2017. Archivováno z originálu 31. července 2017.
  9. Harris, Derrick Spouští se startup s názvem Skymind, který prosazuje hluboké učení s otevřeným zdrojovým kódem . GigaOM.com (2. června 2014). Získáno 29. června 2014. Archivováno z originálu 28. června 2014.
  10. Novet, Jordan Skymind se spouští s open source, plug-and-play funkcemi hlubokého učení pro vaši aplikaci (2. června 2014). Získáno 29. června 2014. Archivováno z originálu dne 28. září 2020.
  11. Archivovaná kopie (odkaz není dostupný) . Získáno 25. července 2017. Archivováno z originálu 25. února 2017. 
  12. Deeplearning4j Visualization Tools (downlink) . Získáno 25. července 2017. Archivováno z originálu 10. srpna 2017. 
  13. Deeplearning4j Computation Graph (downlink) . Získáno 25. července 2017. Archivováno z originálu 10. srpna 2017. 
  14. Iterativní snížení . Získáno 25. července 2017. Archivováno z originálu 10. června 2018.
  15. DataVec ETL pro strojové učení (downlink) . Získáno 25. července 2017. Archivováno z originálu 2. října 2017. 
  16. Detekce anomálií pro data časových řad s hlubokým učením . Získáno 25. července 2017. Archivováno z originálu dne 28. září 2020.
  17. word2vec . Získáno 25. července 2017. Archivováno z originálu 10. března 2016.
  18. Finance a podvody | Skymind (downlink) . Získáno 25. července 2017. Archivováno z originálu 10. března 2016. 
  19. https://skymind.ai/bsa-aml  (nedostupný odkaz)
  20. Archivovaná kopie . Získáno 22. února 2016. Archivováno z originálu 10. března 2016.
  21. https://skymind.ai/image  (nedostupný odkaz)
  22. https://www.rapidminerchina.com/en/products/shop/product/deeplearning4j/  (odkaz dolů)
  23. Generovaná dokumentace (Bez názvu) . Získáno 25. července 2017. Archivováno z originálu 23. srpna 2017.
  24. GitHub – deeplearning4j/dl4j-benchmark: Repo pro sledování srovnávacího kódu dl4j . Získáno 25. července 2017. Archivováno z originálu dne 22. července 2020.
  25. Benchmarking s DL4J a ND4J | Deeplearning4j (nedostupný odkaz) . Získáno 25. července 2017. Archivováno z originálu 9. srpna 2017. 

Literatura

Odkazy