DataWorks Summit 2019

Sammanslagning skapar nya unika möjligheter för bland annat den finansiella sektorn.

Det var en gång… är som alla vet början på extremt många sagor och även delvis en passade början på årets upplaga av Data Works summit vilket hölls i Barcelona under andra halvan av mars. Anledningen till denna inledning är att historian bakom Cloudera, som ligger bakom eventet, är lite som en saga, en IT-orienterad saga. För att göra en mycket kort sammanfattning så grundades Cloudera 2008, ett företag med en Core fokus på öppen källkod och Big Data.

Tre år senare grundades Hortonworks, ett företag som till 100 % var dedikerade på öppen källkod men som även de med fokus på hanterade av enormt stora datamängder. Men så den 3:e oktober 2018 köpte Cloudera upp Hortonworks och bildade det nya Cloudera, ett företag som tack vare sin kombinerade portfölj, kundstock och tekniska lösningar kliver in som en av de absolut största och mest kompletta företaget inom Enterprisebaserad molnhantering av alla former av data från alla typer av källor eller som Cloudera säger – från Edge-enheter till AI optimera data

Ett väl genomtänkt steg

Men trots att själva uppköpet sköttes förhållandevis diskret och knappast någon mer än de företag som tidigare jobbar direkt med eller på annat sätt haft kopplingar till de båda företagen kände till sammanslagningen så var det inte någon förhastad affär utan resultatet av flera års diskussioner.

  • Trots att vi primärt varit konkurrerande företag så har vi, mycket tack vare arbetet med en öppen plattform, jobbat tillsammans med flera områden under säkert dryga sju år och en diskussion kring en sammanslagning har varit på tal under i varje fall 3,5 år berättar Mick Hollison, CTO på Cloudera.
  • Genom denna sammanslagning så är vi nu tillsammans dryga 3000 personer och 3000 partners i 85 länder där vi har dryga 2000 kunde, och detta är enbart stora Enterprisebolag som jobbar med enorma mängder data. På samma gång så har vi idag avtal med åtta av de tio ledande bankerna, samtliga av de tio största Telco- och bilföretagen och vi jobbar med över 40 av de största regeringarna runt om i världen vilket är siffror som normalt förknippas med företag som AWS och Microsoft, berättar Mick vidare.

För att övergången till den nya, kompletta plattformen, ska gå så smidigt som möjligt har Cloudera sett till att de båda tidigare plattformarna kommer att köras parallellt men att alla funktioner finns i båda portföljerna och kan uppgraderas från CDH5 och CDH6 samt HPD2 och HPD3. Fram tills att den nya enhetliga plattformen blir verklig så kommer respektive lösning att fortsätta precis som tidigare men med de nya möjligheter och funktioner som tidigare bara funnits hos i den andra aktörens plattform.

Enorm kraft för extrem säkerhet och agilitet

Grundtanken med den nya plattformen är att data från alla tänkbara källor och enheter i realtid ska kunna bearbetas och användas via en kombination av ML och AI och ge oss den information var och när helst vi behöver den.

För det är först när vi kan samköra data från mer eller mindre oändligt antal källor och utvinna intelligens från denna som vi till fullo kan ta steget in i framtiden, den framtid där vi har fungerande smarta städer, där vår dröm om fullt självkörande bilar blir verklighet och där de saker som vi idag finner omöjliga blir möjliga.

– En av våra primära ledord är att lägga en grund för att göra det som idag är omöjligt, möjligt i framtiden. Ett bra exempel på detta är NASAs projekt Orion där vi redan 2030 ska skicka människor till Mars. Detta kommer att bli möjligt delvis tack vare Clouderas lösningar för att hantera och bearbeta den data som den robot som nu befinner sig på Mars skickar till oss, säger Mick.

Men det är så klart inte bara framtida projekt som kommer att dra nytta av Clouderas tjänster utan mer eller mindre alla industrier och områden som dagligen behandlar stora datamängder kommer att gynnas och en sådan bransch är utan tvekan försäkrings- och den finansiella sektorn där vi ser fortlöpande allt större krav på säkerhet och skydd i olika nivåer i realtid.

IT-Finans fick under Data Works summit möjlighet att prata med bland annat Sakhuja Abhishek, Technology Leader för Data and Analytics på Everis som är ansvarig för Cloudera integrationen och distributionen på Zurich Insurance Group, med över 55 000 anställda, som gav sin syn på sammanslagningen och vad den innebär för sektorn.

  • Vi använder och har använt Hadoop (HortonWorks) sedan 2015 och detta som en on-premise lösning. Primärt har vi använt lösningen som en data-lake men under senaste tiden så har vi börjat använda dess fulla potential för hantering av datainnehåll och bearbetningsramar, berättar Sakhuja.
  • De stora fördelarna med denna sammanslagning, från vårt perspektiv, är att vi får det bäst av två världslösningar under samma huva. Tidigare var vi tvungna att hålla fast vid specifika distributörskomponenter men nu har vi möjlighet att utnyttja den bästa komponenten baserat på vårt affärsbehov. Till exempel: Apache Hive v / s Impala, Apache Ranger v / s Sentry, Apache Atlas v / s Cloudera Navigator och så vidare vilket underlättar vårt arbete och gör lösningarna enormt kraftfulla.
  • Datastyrning och säkerhet har alltid varit en topprioritering för Zürichförsäkringar och därför har vi utnyttjat Hortonworks mest avgörande Enterpriseoptimerade tjänster för att säkerställa vår miljö. Utöver det hade denna sammanslagning fått ytterligare ett tillfälle för oss att använda både HortonWorks och Cloudera-säkrade tjänster som Ranger, Knox, Atlas, Sentry, Cloudera Navigator, allt baserat på olika företagskrav. Det viktiga i detta läge är att säkerhets delen blivit allt mer komplett och att vi numera kan hålla oss till en aktör vilket underlättar från ett administrativt perspektiv.

Det är även på just områden som säkerhet som även vi ser den stora vinningen av nya Cloudera plattformen där samkörning av multipla datakällor verkligen kan upptäcka och avvärja eller blockera realtidsbedrägerier av mer eller mindre alla slag och här kan de företag som är tidiga med att följa med i övergången skaffa sig klara marknadsfördelar. En viktig del i allt detta är sedan att alltid kunna följa de olika regelverk för hur data ska hanteras vilket kan skilja ganska mycket från land till land och delvis även inom olika regioner.

  • En av våra större utmaningar ligger i just genomförandet av styrning över regioner på grund av olika regler som ändras varje 100 mil, i grova drag. Vid Zürich försäkringar ser vi till att vi styr dessa delar med högsta kvalitet över både globala och lokala regioner och även här ser vi att en allt mer unifierad och bred plattform kommer att underlätta detta arbete. Framför allt när vi kan applicera såväl ML som AI på vårt data och låta allt mer hanteras med automatik.
  • Tittar vi på dagens HDP och CDH eller i än större utsträckning den kommande CDP så finns det i grunden sex områden som gör lösningen/lösningarna så intressanta för vår sektor och dessa är i grova drag;
    – Tack vare Hadoop så får vi marknadsledande open source baserad innovation i alla led
    – Vi får en Enterprise färdig plattform för snabb data analys
    – vi får en komplett driftskompabilitet över hela ekosystemet
    – då allt är 100% Open Source ger det oss full frihet utan att vi låser oss vid en lösning
    – Vi får en extremt stor bas av strategiska ekosystems partners
    – Vi får en full kompabilitet med inte bara ett utan nästan alla former av molnlösningar

10 anledningar till en migrering

För att kort avrunda så har vi plockat ut tio kärnfaktorer för att du som företag ska välja att påbörja en migrering till Clouderas nya plattform och dessa är;

  1. Hantering av stora data mängder och belastningar har aldrig varit så enkel och kraftfull som med Clouderas nya data plattform – CPD.
  2. CDP tillhandahåller en Big Data och Data Science Enterprise färdig plattformslösning.
  3. CDP ger användaren det bästa från två, redan innan, mycket bra världar genom att ta det bästa från HortonWorks och det bästa från Clouderas tjänster sammanfogat i en plattform.
  4. Tack vare att allt, från båda sidor, numera kommer att vara 100 % öppen källkod får användare full valfrihet och blir aldrig inlåsta till ett system eller en lösning.
  5. CPD är den optimala hybrid lösningen där slutanvändaren kan mixa och matcha on-premise, privata och publika molnlösningar nästan helt efter eget tycke och behov.
  6. Flera alternativ för att välja säkerhets- och datastyrningstjänster baserat på de företagsbehov som finns.
  7. CPD erbjuder markant förbättrade datavetenskapliga erfarenheter.
  8. Effektiv implementering av hela Lambda-arkitekturen.
  9. Realtids dataintag med Cloudera Data Flow
  10. Kanske den mest kompletta hjälpen för att skapa en effektiv miljö för Edge till ML ramverk.