Cloudera

Společnost Cloudera Inc.
Typ veřejná společnost
Výpis na burze NYSE : CLDR
Základna 2009
Zakladatelé Christophe Biscilla,
Amr Awadalla,
Jeffrey Hammerbacher,
Michael Olson
Umístění  Spojené státy :Palo Alto
Klíčové postavy Reilly, Tom (CEO),
Doug Cutting (hlavní architekt)
Průmysl vývoj softwaru ( ISIC :) 6201
produkty Komerční verze Hadoop , Cloudera Impala
obrat 301 milionů $ (2018)
Provozní zisk −389 milionů $ (ztráta, 2018)
Čistý zisk −386 milionů $ (ztráta, 2018)
Kapitalizace 2,66 miliardy $ (7. září 2018) [1]
webová stránka cloudera.com
 Mediální soubory na Wikimedia Commons

Cloudera  je americká společnost, která vyvíjí distribuce Apache Hadoop a řadu softwarových produktů pro ekosystém Hadoop .

Obchodní model společnosti byl přirovnáván k podnikání společnosti Red Hat  – Cloudera vytváří distribuce softwarových produktů pro organizace založené na svobodném softwaru a vytváří zisk poskytováním technické podpory pro dodávaná řešení [2] [3] . S rozmachem technologií „ big data “ byla Cloudera opakovaně uznávána jako jedna z nejslibnějších společností schopných řešit problémy ve své třídě [4] [5] .

V roce 2018 pohltila hlavního konkurenta na distribučním trhu Hadoop, americkou společnost Hortonworks .

Historie

Společnost byla založena v říjnu 2008 v Burlingame ( Kalifornie ) s počátečním kapitálem 5 milionů $, hlavním cílem podnikání byla komercializace projektu Hadoop . Zakladateli společnosti jsou Christophe Bischiglia ,  který dříve pracoval ve společnosti Google , Amr Awadallah ( Amr Awadallah , viceprezident Yahoo Corporation , zodpovědný za analytické systémy a ukládání dat), Jeffrey Hammerbacher ( Jeff Hammerbacher , projektový manažer Hive na Facebooku ) a Michael Olson , viceprezident společnosti Oracle Corporation , dříve CEO společnosti Sleepecat , která vyvinula a vyvinula Berkeley DB a byla v roce 2006 pohlcena společností Oracle) [6] . Hammerbacher zajistil počáteční financování projektu od Accel Partners , přičemž Olson převzal společnost. Celkem se v počáteční fázi vybralo 11 milionů dolarů a mezi investory jsou kromě Accelu uvedeni Greylock Partners a business angels Gideon Yu a Caterina Fake [ 7 ] .

Mezi zaměstnanci najatými v prvních měsících byli tvůrci Hadoop Doug Cutting a  Mike Cafarella , bývalí generální ředitelé společností VMware ( Diane Green ) a MySQL AB ( Marten Mikos ) [8] . Díky přesunu Cuttingu do Cloudery byla společnost popsána jako „nový vlajkonoš Hadoop“ [9] .

V roce 2009 se Biscilla umístila na pátém místě v seznamu Top 22 Young Tech Entrepreneurs časopisu Businessweek [10] a Hammerbacher se v roce 2010 umístil na sedmém místě (z 15) . V nominaci Biscilla byla Cloudera popsána jako servisní společnost poskytující technické poradenství ohledně Hadoopu, zatímco Hammerbacherův příspěvek v roce 2010 byl zaznamenán jako transformace podnikání společnosti, což z ní činí poskytovatele replikovatelného softwaru pro organizace [11] .

V listopadu 2011 společnost získala další finance ve výši 40 milionů $ [12] , v prosinci 2012 - dalších 65 milionů $ [13] , mezi investory dalších kol jsou Ignition Partners , Greylock , Accel , Meritech Capital Partners a In -Q-Tel [ 14] [13] .

V říjnu 2012 společnost představila produkt Impala , který poskytuje SQL přístup k datům v clusteru řízeném Hadoopem, vzhled takového produktu byl přivítán jako překvapení, protože převládající rétorika společností zaměřená na „velká data "technologie" bylo opuštění tradičních technologií založených na SQL ( anglicky  old SQL , v souladu se " starou školou " - old school ) [15] .

V červnu 2013 byl na pozici generálního ředitele pozván Tom Reilly , který předtím vedl dvě technologické společnosti k převzetí významnými hráči ( výrobce MDM systémů Trigo byl koupen IBM v roce 2004 a ArcSight byl přiveden na IPO a brzy pohlcen společností Hewlett-Packard v roce 2010) je událost hodnocena jako příprava buď na primární veřejnou nabídku, nebo na prodej podniku [16] . Olson přešel na post strategického ředitele a předsedy představenstva. V červenci 2013 firma převzala britskou společnost Myrryx , kterou založil Sean Owen , jeden z hlavních autorů škálovatelného rámce strojového učení v ekosystému Hadoop Apache Mahout , Owen byl oznámen jako „ředitel datové vědy “ ( anglický ředitel datové vědy ) [17] .  

Do poloviny roku 2013 získala společnost v pěti kolech investic celkem 141 milionů $ [16] a v dalším kole v březnu 2014 získala společnost dalších 160 milionů $ [18] . V březnu 2014, po šestém kole investic, Intel získal 18% podíl ve společnosti za 740 milionů $, čímž ohodnotil podnikání Cloudery na přibližně 4 miliardy $ [19] ; Intel zároveň opustil vývoj vlastní distribuce Hadoop vytvořené o rok dříve ve prospěch propagace řešení od Cloudery [18] . V červnu 2014 společnost získala vývojáře technologie šifrování dat Gazzang [20] .

V dubnu 2017 společnost uspořádala první veřejnou nabídku na burze v New Yorku , v důsledku čehož získala 215 milionů $ [21] . Na podzim roku 2017 byla převzata newyorská firma strojového učení Fast Forward Labs, dohoda byla zaznamenána jako reakce na úzkou integraci Hortonworks s IBM, která klade důraz na vývoj systémů umělé inteligence v rámci programu Watson , a opustil svou distribuci Hadoop ve prospěch Hortonworks [22] .

V říjnu 2018 byla oznámena fúze s Hortonworks, přičemž struktura si ponechala jméno Cloudera, kotaci na burze a generálního ředitele a akcionáři Hortonworks získali 40 % akcií sloučené společnosti [23] . Transakce byla dokončena 3. ledna 2019, navzdory celkovému ocenění obou společností v době oznámení na 5,2 miliardy USD, po jeho dokončení činila kapitalizace spojeného obchodu přibližně 3 miliardy USD [24] . Převzetí ve skutečnosti dokončilo fázi konsolidace na trhu komerčních distribucí Hadoop (z ostatních významných účastníků trhu zůstala pouze MapR s ročním obratem asi 175 milionů $ v roce 2018), čímž se těžiště konkurence přesunula do širších segmentů. - nástroje pro velká data a analytické platformy [25] .

Na konci roku 2020 společnost odkoupila akcie od Intelu za 314 milionů $ (o 426 milionů $ méně než investice v roce 2014) [26] .

CDH

CDH ( Cloudera 's  Distribution včetně Apache Hadoop ) je distribuce Apache Hadoop, která zahrnuje řadu souvisejících programů a knihoven a vlastní vývojové nástroje Cloudera, volně distribuované a komerčně podporované pro určité distribuce Linuxu ( Red Hat Enterprise Linux , CentOS , Ubuntu , SuSE SLES , Debian ). Mezi softwarové projekty Apache související s Hadoopem distribuce zahrnuje: Flume , HBase , Hive , Mahout , Oozie , Pig , Sqoop , Whirr , Zookeeper . Distribuce navíc obsahuje vlastní subsystém správy clusteru Cloudera Manager , který obsahuje skripty pro nasazení infrastruktury Hadoop jak v lokálním, tak cloudovém prostředí ( Rackspace , Amazon EC2 , Softlayer ), stejně jako utility a konfigurace pro podpora automatizace sestavení pomocí Apache Maven .

Začátkem roku 2012 byly dodávány dvě verze CDH, CDH2 (založená na Hadoop 0.20.1) a CDH3 (založená na Hadoop 0.20.2). Distribuce CDH3 je součástí dodávky hardwarového a softwarového komplexu zařízení Oracle Big Data [27] , navíc první linii zákaznické podpory pro Hadoop poskytuje Oracle Corporation a Cloudera poskytuje technickou podporu pro složitější problémy. V polovině roku 2012 byla vydána verze CDH4 založená na Hadoop 2.0 (včetně modulu YARN ), v CDH4 jsou také zahrnuty tři vlastní produkty společnosti - Hue (rozhraní prohlížeče pro správu clusteru Hadoop), Impala a Hledat (fulltextové a fasetové vyhledávání v prostředích HDFS a HBase ). V roce 2014 byla vydána verze CDH5; verze CDH6, vydaná na jaře 2018, je založena na Hadoop 3.0 (jehož klíčovou novinkou byla podpora kódování pro opravu chyb pro HDFS, které může výrazně snížit fyzickou velikost clusterů) [28] .

Impala

Cloudera Impala  je masivně paralelní dotazovací stroj SQL pro data uložená v HDFS a HBase , distribuovaný pod licencí Apache 2.0 . Na rozdíl od Hive , který překládá dotazy v jazyce podobném SQL (HiveQL) do úloh MapReduce prováděných v dávkovém režimu, Impala provádí dotazy v distribuovaném prostředí interaktivně a rozděluje dotaz mezi zpracovatelské uzly na základě vlastního mechanismu, aniž by se uchýlil k MapReduce.

Cloudera Manager

Cloudera Manager  je specializovaná komponenta, která umožňuje automatizovat vytváření a úpravy prostředí Hadoop, sledovat a analyzovat efektivitu zpracování úloh, nastavovat upozornění na výskyt určitých událostí souvisejících s provozem infrastruktury distribuovaného zpracování. Roční náklady na technickou podporu jsou asi 4 000 USD na uzel clusteru [29] . K dispozici je bezplatná edice pro Cloudera Manager ( anglicky  free edition ), která funguje pouze na clusterech skládajících se z méně než 50 uzlů a postrádá řadu funkcí dostupných komerčním předplatitelům (jako je sledování výkonu, verzování konfigurace, podpora Kerberos ).

Tematické produkty

V návaznosti na předpovědi společnosti Garnter v cyklu humbuku technologie správy dat v roce 2017, že samotný koncept „distribuce Hadoop“ brzy přestane být zastaralý, přesunula společnost svou produktovou nabídku na tematické sady, složené z prakticky stejných komponent, které jsou sestaveny v CDH, ale zaměřené na určité specifické úkoly. V roce 2018 se tedy produkty objevily pod názvy Data Warehouse (sestavení pro datové sklady , se zaměřením na Impala), Operational DB (pro provozní databáze, kolem HBase , Kudu a Spark ), Data Engineering (pro ETL a interaktivní přístup k datům), Data Science (pro úkoly " data science " ), Enterprise Data Hub (pro podnikové datové platformy - ve skutečnosti kompletní sestava distribuce Hadoop plus datový katalog založený na vlastní SDX komponentě).

Od roku 2018 se cenová politika formuje kolem tematických produktů; V závislosti na konfiguraci platí předplatitelé ročně od 4 000 USD za podporu každého produktového uzlu Data Engineering a Data Science do 10 000 USD za uzel produktu Enterprise Data Hub.

Poznámky

  1. Cloudera Inc. Jitřenka (7. září 2018). Archivováno z originálu 7. září 2018.
  2. Malik, 2009 , Vidím některé zajímavé paralely mezi Hadoopem a Red Hatem, které se dostaly do popředí díky Red Hat Linuxu, verzi Linuxu optimalizované pro firemní uživatele.
  3. Rao, 2011 , Cloudera pomáhá distribuovat Hadoop a poskytuje praktické služby kolem této technologie, podobné tomu, co Red Hat dělá pro linuxový framework.
  4. Nairn, 2010 , Storage gigant EMC se spojil s Cloudera, specialistou na databázový software, aby vytvořili technologie pro lepší podporu „velkých dat“ … Startup Cloudera používá open source softwarový balík Hadoop k analýze velmi rozsáhlých sad dat.
  5. Vance, 2011 , „Budou to kluci jako Jeff, kteří pochopí, co dělat s velkými daty“.
  6. Prickett-Morgan, 2009 , ...Christophe Bisciglia, který vedl partnerství mezi společnostmi Google, IBM a National Science Foundation s cílem vytvořit mřížky Hadoop pro akademiky, se kterými si mohou hrát; Amr Awadallah, bývalý viceprezident pro inženýrství Yahoo, který vedl úsilí o ukládání dat a analýzu za poštovní, vyhledávací, finanční a zpravodajské služby této společnosti; - Mike Olson, bývalý výkonný ředitel výrobce open source databází Sleepycat Software (nyní ve vlastnictví Oracle); a Jeff Hammerbacher, bývalý obří sociální sítě Facebook a manažer, který vytvořil projekt Hive, což je vrstva datových skladů, která funguje ve spojení s Hadoop a kterou Facebook používá k analýze dat na svých mnoha petabajtech informací uložených ve svých uživatelských datech. sklad.
  7. Businessweek, 2010 , Financování: 11 milionů dolarů od Accel Partners, Greylock Partners a angel investorů, mezi které patří Gideon Yu a Caterina Fake.
  8. Prickett-Morgan, 2009 , …Doug Cutting a Mike Cafarella jako poradci a také Diane Green (zakladatelka a bývalá generální ředitelka společnosti VMware na virtualizaci) a Marten Mikos.
  9. Šikovný, Alexi. Tvůrce Hadoopu jde do Cloudera  (anglicky)  (downlink) . SD Times (9. října 2009). Získáno 25. prosince 2011. Archivováno z originálu 11. března 2012.
  10. Businessweek, 2010 , spoluzakladatel Cloudera Christophe Bisciglia byl jedním z nejlepších mladých technologických podnikatelů Bloomberg BusinessWeek roku 2009.
  11. Businessweek, 2010 , Nejtěžší rozhodnutí: Změna obchodního modelu Cloudery tak, aby se z ní stal dodavatel softwaru.
  12. Worthene, Bene . Tide Shifts on Web Start-Ups  (anglicky) , N. Y .: The Wall Street Journal  (22. listopadu 2011). Archivováno z originálu 25. prosince 2011. Přístupné 28. prosince 2011.  „Od té doby bylo uzavřeno více velkých finančních dohod, včetně 85 milionů USD pro výrobce lidských zdrojů Workday Inc., 81 milionů USD za online web pro sdílení souborů Box.net Inc., 50 milionů USD na marketing společnost Marketo Inc. a 40 milionů dolarů pro společnost Cloudera Inc.
  13. 1 2 Darrow, Barb Cloudera nastražila 65 milionů dolarů navíc, aby podpořila růst mezinárodního podnikání  (  nepřístupný odkaz) . Gigaom (6. prosince 2012). — "Kolo financování vedla společnost Accel Partners s pomocí Greylock Partners, Ignition Partners, In-Q-Tel a Meritech Capital Partners." Datum přístupu: 10. prosince 2012. Archivováno z originálu 17. prosince 2012.
  14. Rao, 2011 , Cloudera právě oznámila nové financování ve výši 40 milionů USD vedené společnostmi Ignition Partners, Greylock, Accel, Meritech Capital Partners a In-Q-Tel.
  15. Brust, Impala od Andrewa Cloudery přináší Hadoop do SQL a BI . Produkt Impala miláčka Cloudery z velkých dat povyšuje SQL na rovnocennou úroveň pomocí  MapReduce . ZDNet (25. října 2012) .  „Namísto toho, aby vyzvala odborníky na databáze a BI ze staré školy (tj. většinu podnikových vývojářů a DBA), aby přešli na Hadoop, oznámila beta verzi nového produktu Impala, který jim přináší Hadoop.“ Získáno 1. ledna 2014. Archivováno z originálu 2. ledna 2014.
  16. 1 2 Prickett Morgan Cloudera zvolil nového generálního ředitele pro nevyhnutelný tlak na IPO nebo akvizici . Bývalý generální ředitel se stává předsedou představenstva a hlavním  stratégem . The Register (20. června 2013) . Získáno 1. ledna 2014. Archivováno z originálu 2. ledna 2014.
  17. Clark, akvizice Jacka Cloudery: Je to Myrrix (strýc) . Slon odfrkne slůně pro dovednosti strojového učení  (anglicky)  (downlink) . The Register (16. července 2013) . Získáno 17. července 2013. Archivováno z originálu 31. srpna 2013.
  18. 1 2 Harris, Dereck Intel zahazuje své distro Hadoop a staví miliony za  Cloudera . Gigaom (27. března 2014). Získáno 1. dubna 2014. Archivováno z originálu 30. března 2014.
  19. Clarku, Jacku Nedotýkej se mého kufru! Intel je po cash shotu Cloudera o 740 milionů dolarů lehčí . Obrovská finanční dohoda drží Oracle, IBM daleko od žlutého  slona začátečníka . The Register (31. března 2014) . Získáno 1. dubna 2014. Archivováno z originálu 4. dubna 2014.
  20. Liam Tung. Cloudera kupuje společnost Gazzang pro šifrování velkých dat . Cloudera kupuje Gazzang, aby podnikovým zákazníkům nabídla šifrování pro data v klidu v clusterech Hadoop . ZDNet (15. června 2014) . Získáno 23. září 2018. Archivováno z originálu 25. září 2019.
  21. Anita Balakrishnan. Akcie Cloudera uzavřely první den o více než 20 % výše . CNBC (28. dubna 2017). Staženo 23. září 2018. Archivováno z originálu 23. září 2018.
  22. Rebecca Hillová. Cloudera zahání AI biz, sleduje zákazníky IBM… a nadále hlásí provozní ztráty . Někdo si všiml dohody Big Blue s Hortonworks . The Register (8. září 2017) . Staženo 23. září 2018. Archivováno z originálu 23. září 2018.
  23. Kevin Kelleher. Akcie Cloudera a Hortonworks stoupají, protože rivalové z velkých dat ohlásili fúzi za 5,2 miliardy dolarů . Fortune (3. října 2018). Získáno 4. října 2018. Archivováno z originálu dne 4. října 2018.
  24. Rebecca Hillová. Cloudera, Hortonworks se po hlasování akcionářů sloučily do amorfního blobu pro správu dat . Firma s novým vzhledem obrací pozornost k PR ofenzívě . The Register (7. ledna 2019) . Získáno 7. ledna 2019. Archivováno z originálu 8. ledna 2019.
  25. Andrew Brust. Fúze Cloudera a Hortonworks se uzavírá; quo vadis Big Data? . Dva největší distributoři Hadoop jsou nyní jedním. Co to znamená pro svět Big Data, pro zákazníky a pro Apache Hadoop? . ZDNet (4. ledna 2019) . Staženo 7. ledna 2019. Archivováno z originálu 31. ledna 2019.
  26. Max A. Cherney. Cloudera koupí zpět podíl Intelu za 314 milionů dolarů. Zde je uvedeno, co to znamená pro akcie . Barron's (23. prosince 2020). Získáno 25. prosince 2020. Archivováno z originálu dne 25. prosince 2020.
  27. Pricket Morgan, Timothy Oracle nasedá na slona Cloudera pro jízdu na velkých datech  (anglicky)  (odkaz není k dispozici) . The Register (10. ledna 2012). Datum přístupu: 13. ledna 2012. Archivováno z originálu 6. září 2012.
  28. Tony Baer. Cloudera Enterprise 6 vyráží do ulic . Hadoop 3.0 hraje hlavní roli v příštím vydání platformy Cloudera . ZDNet (22. května 2018) . Získáno 23. září 2018. Archivováno z originálu 27. listopadu 2020.
  29. Pricket Morgan, Timothy. Cloudera je proaktivní se správou Hadoop  (eng.)  (downlink) . The Register (8. září 2011). Získáno 15. dubna 2013. Archivováno z originálu 18. dubna 2013.

Odkazy