Dataplattformer

Dataplattformer

Hva er en dataplattform, og hva slags muligheter gir den? Her vil du lære om dataplattformer, hvem det er for og hva som skal til for å komme i gang.

Hvor kompliserte er dataene – og målsettingen?

Husker du Geir, han som selger iskrem? Han vil lage noen enkle visualiseringer som kan hjelpe ham å se hvor og når han bør plassere ut vognene sine for å selge mest mulig is. Enkelt og greit! Men det er et eksempel på barneskole-nivå. Det er ikke alltid fullt så enkelt i den virkelige verden.

I den andre enden av skalaen har du en olje & gass-operatør som vil gjøre produksjonen sin mer effektiv og bærekraftig. For å få til dette vil de samle data fra alle ledd i produksjonen og forsyningskjeden, og analysere den for å finne ut hvordan de kan optimalisere driften. Da kan vi snakke om titusener eller til og med millioner av datakilder. Virksomheten har flere maskiner og installasjoner enn noen orker å telle, hver av dem med sensorer, tidsseriedata, kontrollsystemer, vedlikeholdsdata, utstyrsdata…

I slike kompliserte tilfeller vil virksomheten for det første trenge en partner, et selskap som spesialiserer seg på disse tingene (med mindre de har, eller bygger opp, et eget fagmiljø). Sammen med partneren vil de så gå i gang med å samle dataene, rydde opp og bearbeide dem slik at de kan sammenlignes og tas i bruk. Til dette formålet bruker vi en dataplattform.

Dataplattformer

Mange virksomheter har over tid lagret data i ulike systemer, databaser og servere. Dataene ligger i siloer, slik vi forklarte under forrige etappe. Det blir fort komplisert å hente ut, sammenstille, tolke og bruke dataene til noe. Samtidig stilles det stadig høyere krav til gode brukeropplevelser og raskere responstid. Behovet for enklere og raskere måter å utnytte data på, i sanntid, blir derfor stadig viktigere.

Datastrømming og dataplattformer hjelper oss med dette (se 👩‍💻 faktaboks).

👩‍💻 Teknologier: Datastrømming og dataplattformer

Dataplattformer er programvareløsninger som lar virksomheter samle data fra mange ulike kilder på ett og samme sted. Her vil dataene rengjøres og transformeres, for eksempel slik at de bruker samme format og verdier, og blir sammenlignbare med data fra andre kilder. En plattform kan automatisere mye av det vi gikk gjennom i starten av etappen, i listen «Opprydning på 1-2-3».

Datastrømming er navnet vi bruker om den kontinuerlige strømmen av data fra ulike kilder til og fra dataplattformen. Data mottas, samles og distribueres via en meldingskø. De bearbeides i sanntid, lagres og ny informasjon presenteres tilbake til kilden den kom fra – eller andre steder. Data kan for eksempel komme fra sosiale nettverk, serveraktivitet, sensorer, mobil- og nettbruk, kjøp og salg av varer eller geografisk plassering. Bearbeidet data fra plattformen kan i neste omgang visualiseres, analyseres, brukes i applikasjoner og mye mer, som vi skal se i neste etappe.

Kort oppsummert kan vi si at en dataplattform …

samler data fra mange kilder

rydder opp i dataene, og setter dem i en sammenheng som gir mening, og 

gjør dem tilgjengelige og brukbare for mennesker og maskiner

Det blir enklere å håndtere store datamengder og gjøre disse tilgjengelige, kommunikasjonen mellom ulik programvare blir bedre, og vi får tilgang på sanntidsinformasjon, noe som blir stadig viktigere i mange sammenhenger.

Plattformer henger tett sammen med skytjenester, som vi forklarte under forrige etappe. Mange av de viktigste plattformene er del av eller bygger på skytjenestene til Amazon, Google og Microsoft.

Data er i bevegelse hele tiden, og etter hvert som datamengdene øker, er det viktig at prosesseringen skjer raskt. Vi trenger dataplattformer for å hente data ut av siloene sine, håndtere datastrømmen, sammenstille dataene – og så sende prosserert data ut igjen, der den skal tas i bruk.

Virksomhetens applikasjoner (som vi skal se på i neste kapittel) kan få de dataene de trenger, i formatet de trenger, fra plattformen gjennom API-er. Sannsynligvis har mange av datakildene deres (diverse systemer, databaser og servere) allerede et API dere kan bruke for å hente ut de dataene dere trenger.

Hvordan komme i gang med en dataplattform

Dataplattformer er ikke bare for olje & gass-operatører med millioner av datakilder. Til og med iskrem-Geir kan benytte seg av mulighetene som ligger der. Plattformene kommer nemlig med vanvittig mange muligheter og verktøy, som er aktuelle for alle som ønsker å bruke data til å drive frem nye løsninger og forbedringer. Men la oss bare si at det i Geirs tilfelle trolig ville vært litt «overkill».

En dataplattform kan automatisere rengjøringen og transformasjonen av dataene til bedrifter med et stort og komplisert datatilfang. Men å sette opp dette slik at det fungerer, kan være omfattende og krevende arbeid, som krever mye spesialkompetanse. I slike tilfeller vil en som sagt trolig være tjent med å løse dette sammen med en partner. Men når det først er oppe og går, kan det imidlertid komme alle til gode i arbeidshverdagen uten at alle trenger å forstå hva som foregår bak kulissene.

Hvis Geir likevel ønsker å bruke en plattform, kan han med sitt mye enklere datatilfang kanskje klare å sette opp dette på egenhånd. Da kan han få god hjelp av såkalte SDK-er eller «devkits» (se 👩‍💻 faktaboks).

👩‍💻 Teknologier: Software development kit (SDK)

SDK står for Software Development Kit, eller «devkit» på folkemunne. Det betyr programvareutviklingssett, og er akkurat det det høres ut som – nemlig en startpakke som hjelper deg å utvikle programvare for en bestemt plattform.

For eksempel trenger du en Android SDK for å lage en Android-app. Settet vil typisk inneholde API-er, guider og veiledning, eksempler på kode, dokumentasjon, debugging-verktøy og annet du kan trenge for å komme i gang. SDK-er kan hjelpe bedrifter med å koble sammen sine egne datasett og programmer med tredjeparts programvare eller dataplattform, og med å utvikle applikasjoner som tar i bruk dataene.

Hvem trenger en dataplattform?

Ikke alle trenger å ta i bruk en dataplattform. Men mange virksomheter kan potensielt ha mye å tjene på å få tilgang på data og innsikt fra kunder og samarbeidspartnere som bruker dem. Plattformen er ikke bare et produkt, men representerer også et tankesett om å være datadrevet. 

En stor del av det som gjør dataplattformer så verdifulle, er at ikke bare kan koble sammen ulike datakilder, men også «koble sammen» partnere, leverandører og kunder i samme økosystem. Data blir mer verdifulle dess mer de brukes, og innsikt fra data er en viktig ingrediens i utviklingen av nye løsninger. Dermed blir en dataplattform en kraftfull innovasjonsdriver.

For eksempel: Når du først har samlet dataene dine og satt dem i sammenheng – hvorfor ikke direkte involvere leverandørene dine, for eksempel utstyrsprodusenter, og la dem bruke de tilgjengelige dataene og innsiktene for å forbedre produktene sine? Det vil gagne begge parter.

Eller hvis du selv er en leverandør: Å koble seg til kundens dataplattform kan la deg se sanntidsdata fra produktet eller tjenesten din i bruk, innenfor en større kontekst, på en måte som ville vært vanskelig eller umulig ellers. Det kan gi verdifulle innsikter.  

Før var det slik at en leverandør solgte et produkt, leverte det, og neppe så noe til det igjen. Nå ser vi helt nye forretningsmodeller der for eksempel leverandører i industrien ikke selger produktene sine i det hele tatt, men simpelthen tar betalt for «oppetid», mens de selv beholder eierskap, holder utstyret ved like, og monitorerer det gjennom dataplattformen.

I neste steg skal vi se på hva du kan få til selv med litt enklere datasett, og i tilfeller der du kan finne andre verktøy enn en dataplattform.