Data er gull verdt. Kom i gang med datainnsamling og dataanalyse
Hvordan bruker vi egentlig data, og hvor viktig er det for norske bedrifters framtid? Her er det du må vite for å komme i gang.
De mest fremoverlente og verdifulle selskapene verden i dag er datadrevne. Det betyr at de samler inn og analyserer data knyttet til virksomheten sin – og bruker dem for å effektivisere driften og forbedre sine egne produkter og tjenester.
Alle typer virksomheter kan jobbe på denne måten. Enten dere er et elektrikerfirma, en lokal butikk eller et multinasjonalt teknologiselskap, kan god bruk av data gjøre dere mer lønnsomme, effektive og attraktive overfor deres kunder og interessenter.
Så hva innebærer dette i praksis? Hvilke data har dere tilgang på, og hva kan dere gjøre med dem?
I denne store guiden vil du lære alt det grunnleggende du må vite om datainnsamling og dataanalyse – for å komme i gang og jobbe mer datadrevet.
Data og analyse: Slik skaper det verdi
For å si det enkelt kan vi si at data skaper verdi når de settes i system og kombineres med andre data.
Tre ting du kan bruke data til
Innsikt og beslutningsstøtte
Data som samles inn, kombineres og sammenstilles, kan for eksempel brukes til å gi innsikt og beslutningsstøtte. Til å tolke og utnytte disse opplysningene trenger man ofte hjelp fra analyseverktøy og andre digitale hjelpemidler, for eksempel ulike visualiseringer og dashbord.
Applikasjoner og arbeidsstøtte
Data kan også samles inn og bearbeides til bruk i ulike applikasjoner, for å optimalisere og automatisere virksomhetens prosesser.
Dataanalyse og modellering
Med avansert dataanalyse, datamodellering og maskinlæring kan en også bruke data til å forutse og planlegge for hvordan et system eller en prosess vil oppføre seg fremover i tid.
Bruk data på en eller flere av disse måtene – og det kan være nøkkelen til innovasjon, økt konkurransekraft og vekst.
Før du kommer dit, er det riktignok noen steg en må gjennom: Du må identifisere hvilke data dere har og trenger; ha systemer for datainnsamling fra ulike kilder; sørge for god datakvalitet, og så videre. Dette er ting vi skal gå gjennom senere i denne guiden.
Aller først må du imidlertid vite hva du prøver å oppnå. Skal du optimalisere en kundereise? Ønsker du å frigjøre tid for dine ansatte? Formuler en klar idé om hva du skal bruke dataene til og hva du leter etter.
Sett mål: Hva kan du oppnå med data?
- Øke utnyttelsen av ansattes tid og kompetanse (f.eks. automatisere manuelle oppgaver, optimalisere arbeidsprosesser)
- Øke kvaliteten på produkter og tjenester (f.eks. identifisere og oppfylle kundens reelle behov, tilby bedre kundeservice)
- Gjøre produksjon mer effektiv og bærekraftig (f.eks. minimere nedetid på maskiner, gjøre vedlikehold mer presist og effektivt)
- Utvikle helt nye produkter og tjenester (basert på innsikter fra dataanalyse, eller applikasjoner som lar dere jobbe på nye måter)
- Jobbe mer målrettet med markedsføring, kunderelasjoner og salg
– Start med et mindre prosjekt
Marianne Jansson Bjerkman er klyngeleder i Cluster for Applied AI, som fasiliteres av Smart Innovation Norway. Der jobber hun blant annet med å bygge nettverk for å hjelpe norske bedrifter med å utvikle og ta i bruk teknologi som skaper verdi av data.
– Data er helt enkelt informasjon i form av fakta og statistikk som samles inn fra ulike kilder. Det kan dreie seg om numeriske størrelser, eller data av mer kvalitativ natur. Data danner grunnlaget for å dele kunnskap og informasjon mellom mennesker, sier hun.
Bjerkman forteller at det ofte er først når man kombinerer data fra ulike kilder, at nye sammenhenger og mønstre åpenbarer seg og danner grunnlag for innsikt og gode beslutninger.
I praksis blir dette som en regneoppgave, med en X (f.eks. kundedata) og en Y (f.eks. produktdata) som til sammen gir et lønnsomt fasitsvar. Heldigvis slipper vi å gjøre matematikken selv når den blir for komplisert:
– Å kombinere informasjon og se mønstre og sammenhenger er vi som mennesker godt vant med. Vi er faktisk «programmert» til det! Men når datasettene blir store, strekker vi ikke alltid til, og her kommer kraftigere analyseverktøy som for eksempel maskinlæring og kunstig intelligens inn, sier hun.
For å komme i gang med dette i egen bedrift, anbefaler hun å starte med et mindre prosjekt, for eksempel knyttet til en bestemt operasjon:
– Det kan være en god øvelse for å bli bedre kjent med de forutsetninger og behov man har knyttet til innsamling og håndtering av data.
Dersom bedriften selv ikke har kompetansen, bør man finne en partner som kan tilføre dette. Bjerkman avkrefter også myter om at digital databehandling er vanskelig:
– Absolutt ikke! Jeg vil si det er enklere å arbeide med digitale prosesser enn med tradisjonelle og manuelle metoder. Men med manglende kunnskap kan det virke uoverkommelig. Til sist vil man imidlertid se at gevinstene er langt større enn opprydningsjobben man må gjennom.
– Hva er fallgruvene ved å ignorere potensialet til data?
– Uten tilgang på rett data, vil man i større grad operere i blinde. Stordata kan for mange være en svært viktig katalysator for omstilling og innovasjon, som igjen vil kunne føre til vekst. Effektiv databehandling og analyse vil dessuten kunne danne grunnlag for mer bærekraftig drift, mer sirkulære forretningsmodeller og dermed økt konkurransekraft, avslutter Bjerkman.
Metoder for datainnsamling
Når du har satt et mål, er neste skritt å identifisere hva slags data dere trenger – og hva dere skal gjøre med den.
Dette kan være riktig tidspunkt for å koble på ekstern hjelp dersom dere mangler den nødvendige kompetansen internt. Dere kan blant annet trenge hjelp til å identifisere hva dere vil behøve av digitale løsninger og teknologi.
Kartlegg data
Datainnsamlingen starter med å kartlegge og identifisere relevante data. Hvilke data trenger dere for å nå dette målet? Hva slags data er det og hvor finnes den? Ser vi etter sanntidsdata (som er «live») eller historiske data (registrert på et tidspunkt i fortiden)?
Identifiser datasiloer
Mest sannsynlig vil dere uansett finne at dataene må samles fra flere kilder, ryddes opp i og bearbeides før det er brukbart. Her er det vanlig å si at dataene finnes i «siloer» – spredt på tvers av forskjellige applikasjoner, lokale servere, i nettskyen, i e-postvedlegg, hos leverandører – og så videre.
I noen tilfeller kan det være aktuelt å laste ned data fra de ulike kildene og samle dem på samme sted manuelt. Men når vi snakker om å jobbe datadrevet, vil dette som regel ikke være hensiktsmessig. Da snakker vi heller om automatiserte metoder for datainnsamling.
For å forstå dette, er det et par ting vi kjapt trenger å forklare: Integrasjoner og API-er, og datastrømming og dataplattformer.
Integrasjoner og API-er
De vanligste metodene for datainnsamling fra ulike kilder er å bruke integrasjoner og API-er (programmeringsgrensesnitt) – det vil enkelt forklart si at man bygger broer mellom ulike programmer for å få dem til å «snakke sammen» og utveksle data.
Tjenester som Yr og Kartverket har for eksempel allerede API-er som en kan knytte til sine egne programmer for å hente inn oppdaterte vær- og kartdata fortløpende. Tilsvarende kan en sette opp med sine egne interne datakilder.
Datastrømming og dataplattformer
Datainnsamling betyr også at du må samle dem et sted. Dette «stedet» vil i mange tilfeller være en form for skybasert dataplattform. Det vil si at en strømmer dataene fra ulike kilder til en skytjeneste som er satt opp for å samle og sammenstille dataene.
På denne plattformen kan en så bygge et applikasjonslag der en tar dataene i bruk, enten det skulle være i form av et dashbord, en mobilapp, digitale tvillinger eller noe annet.
Datainnsamling og datakilder: Interne og eksterne data
Så – hva slags data har dere? La oss se på noen varianter av hvor data kan finnes, og hva slags tilgang en har på dem.
Interne data
Alle bedrifter har egne, interne data.
Det kan være data om ting som salg, innkjøp, lager, markedsføringskanaler, økonomi, kunder, utstyr, transport, prosesser og leverandører og mye annet – som er lagret på tvers av alle deres datasystemer.
Dette kan være data dere eier og kontrollerer selv. Eller det kan være data som deles med andre og har flere interessenter, slik at de ikke nødvendigvis kan brukes fritt.
Eksterne data
Eksterne data er data som dere kan ha tilgang på, men som ikke har opphav i eller direkte tilknytning til bedriften. Eksterne data kan være åpne (offentlige), eller proprietære (de tilhører noen andre).
Åpne, offentlige data kan være for eksempel kartdata, værdata, trafikkdata, og selskapsdata, og data fra andre åpne registre, som det er mulig å hente ut og benytte seg av.
Proprietære data er data fra eksterne kilder som dere ikke eier, og ikke uten videre har tilgang på eller lov til å bruke, men som kan være tilgjengelige mot betaling eller under andre forutsetninger.
– Å kombinere interne og eksterne data åpner spennende muligheter
Helge Dahl-Jørgensen i DigitalNorway jobber med å legge til rette for at norske virksomheter kan få tilgang til og utnytte data til forretningsutvikling og ny verdiskapning. Det første man må gjøre, ifølge Dahl-Jørgensen, er å se mulighetsrommet.
– Sett deg et mål og utforsk potensialet til datainnsamling og bruk av data i din bedrift. Bygg egen kompetanse og søk gjerne gode hjelpere som kan hjelpe å identifisere relevante data, bearbeide den og til slutt integrere data i din virksomhet gjennom digitale verktøy, sier han.
Han forteller at for å se mulighetene, kan det være nyttig å sortere dataene bedriften har tilgang på, i to kategorier: interne og eksterne. Nye spennende muligheter kan oppstå når et selskap evner å kombinere data fra egen virksomhet med relevante eksterne datakilder, mener han.
– Et selskap genererer mye egen data. Det sitter blant annet i kundesystemene dine, i logistikksystemene, i produksjonssystemer og i systemer selskapet benytter sammen med sine kunder og leverandører. Man samler inn data hele tiden!
Eksterne data kan være data som tilbys av private aktører eller tilgjengelige offentlig data. Eksempler på noen offentlige data som brukes i flere ulike bransjer er kartdata, værdata og trafikkdata.
– Kartdata og trafikkdata kan for eksempel brukes til å finne ut effektive leveringsruter. Posisjonsdata kan si deg noe om når potensielle kunder og brukere oppholder seg på bestemte steder. Er det meldt sol i morgen? Da må kanskje bakeriet og sandwich-bedriften sette opp produksjonen, sier Dahl-Jørgensen.
Datakvalitet
Data må ikke bare samles inn, men også bearbeides og ryddes opp i for å bli brukbar.
«Data lineage»
Kjenner du opphavet til dataene og kan du stole på kilden? Vil dataene forbli pålitelige over tid, eller kan noe eller noen plutselig endre dem utenfor din kontroll? Disse hensynene er kjent under det engelske begrepet «data lineage».
Datakvalitet
Det er én ting om dataene er konsistente. Det er noe annet hvorvidt de faktisk stemmer overens med det det skal representere i virkeligheten. Er dataene komplette, eller er det manglende verdier? Er dataene korrekte, eller er det målinger som er gale? Finnes det ekstreme verdier som må fjernes? Gir dataene et riktig bilde av det vi ønsker å undersøke?
Hvis du for eksempel er interessert i å vite hvor mange som har lest en artikkel på nettsiden din, men kun har tall på de som leser på PC – og mangler tall fra nettbrett og mobil – da gir ikke dataene et godt svar på spørsmålet ditt. Dette handler om det som kalles datakvalitet.
Det handler også om å sørge for at riktige variabler er til stede. Var du interessert i å sortere kundelisten etter kjønn, inntekt, jobb eller sivilstatus? Har du i så fall data om dette? Er dataene komplette, eller mangler det verdier?
Format og verdier
Brukes samme formater og verdier konsekvent slik at dataene er sammenlignbare? Dette er også noe en må ta hensyn i datainnsamlingen.
Sortering og konvertering av formater og verdier – dette er ting som kan settes opp for å bli fikset automatisk på en dataplattform. Selve kartleggingsjobben og oppsettet kan imidlertid være krevende, og forutsette ekstern hjelp.
Så gjenstår det å se nærmere på: Hvordan kan vi egentlig ta dataene i bruk?
Noen måter å gjøre det på er som sagt gjennom visualisering, applikasjoner og dataanalyse. La oss se på hver av disse til slutt.
Visualisering
Det er ikke nødvendigvis sånn at løsningen for å skape verdi ut av data må innebære kunstig intelligens, maskinlæring, datamodellering, automatisering eller andre slike avanserte prosesser med et tilhørende buzzord.
Noen ganger er det nok å simpelthen kombinere data fra flere kilder, visualisere dem og legge dem frem på en god måte. Da kan vi synliggjøre ting som ellers ville ha ligget gjemt like foran øynene våre.
Visualisering handler om å formidle et budskap gjennom grafiske og visuelle representasjoner – for eksempel diagrammer, grafer, animasjoner, kart og infografikk.
For å komme i gang må du finne ut hvordan dataene skal presenteres, hvilke data som skal fremheves og i hvilket format – og lære deg å fremstille data i grafer, animasjoner og dashbord.
Applikasjoner
Tenk på ordet applikasjon – å applisere betyr å ta i bruk. Gjennom applikasjoner blir data en del av arbeidsflyten i bedriften og gir reell arbeidsstøtte for sluttbrukere.
Virksomheten kan utvikle sine egne applikasjoner, eller ta i bruk eksisterende programvare. Applikasjonene kan hente data fra en dataplattform eller andre datakilder.
Plattformen kan for eksempel fôre ferdig bearbeidet data til applikasjoner for datadrevet vedlikehold, optimalisering av produksjon og forsyningskjeder, fjernmonitorering og fjernstyring, prosessautomatisering med digitale medarbeidere og mye, mye mer.
For å komme i gang, begynn med å finne ut hvilke prosesser i din virksomhet som egner seg for automatisering. Undersøk også om dette kan gjøres med noen verktøy dere allerede bruker. For eksempel er det mange slike muligheter i en del CRM- og ERP-løsninger.
Data science, datamodellering og maskinlæring
Data science er en tverrfaglig disiplin som kombinerer blant annet programmering, statistikk, dataanalyse og forretningsinnsikt. Avansert dataanalyse og data science gir oss verktøyene for å hente ut verdifulle, ikke-åpenbare innsikter fra dataene våre.
Datamodellering er en sentral del av hva en data scientist gjør. Her vil en kjøre dataene gjennom algoritmer som er laget for å hente ut innsikt fra dataene. For eksempel å finne ut hvorfor noe har skjedd – eller spå hva som kommer til å skje i fremtiden.
Mer spesifikt bruker man her maskinlæring, altså kunstig intelligens. Modellene trenes opp med observerte og historiske data, slik at de blir mest mulig nøyaktige og presise til de skal utføre den reelle dataanalysen.
- Les også: Hva er data science? Slik brukes data til beslutningsstøtte og verdiskapning – DigitalNorway
For å komme i gang, prøv å identifisere et område der dere har data og ønsker å finne ny innsikt eller predikere kommende utfall. Hvis dere ikke har kompetanse i data science, vil dere trolig ønske ekstern hjelp for å gjennomføre prosjektet.
Lær mer
Ønsker du å gå mer detaljert til verks for hvordan du på best mulig måte kan utnytte bruk av data i din virksomhet? Her finner du vår veiviser «Fra data til verdi».
Veiviser
Fra data til verdi
Lær om data og hvordan data gir oss nye innsikter og nye måter å jobbe på.
Tema
Data
Om din bedrift skal kunne ta del i dataøkonomien, må du forstå hvilke data dere faktisk besitter, hvordan du skal forvalte den – og hvordan du kan skape verdi av den.