Hva gjør en data scientist med dataene?

Hva gjør en data scientist med dataene? 

En data scientist kan gjøre data nyttig for bedriften blant annet gjennom å lage modeller; fremheve relasjonene mellom data; visualisere dataene i diagrammer, kart, animasjoner og andre grafiske fremstillinger, og på andre måter å synliggjøre verdifulle innsikter som ellers ville ligget begravet i en masse uforståelige tall, tabeller, programmer og databaser.  

Men før en kommer dit, er det et grovarbeid som må gjøres. Nemlig å grave i disse tallene, tabellene, programmene og databasene, og samle inn og sammenstille data fra ulike kilder. Utgangspunktet kan i mange tilfeller være nokså kaotisk. Kanskje har bedriften sensordata ett sted (for ikke å si ti steder), utstyrsdata et annet, og vedlikeholdsdata et tredje. Finansene ligger borte hos regnskapsavdelingen i enda et separat datasystem. Og så videre. Som prikken over i-en bruker hver av databasene helt ulike verdier og formater på dataene, slik at de ikke uten videre kan sammenlignes.  

Å finne, samle inn, rydde opp i- og organisere de relevante dataene kan være svært tidkrevende og omstendelig arbeid. Derfor jobbes det med å langt på vei automatisere denne delen av jobben, gjennom verktøy som API-er og dataplattformer. Se kursene om industrielle dataplattformer og om API-er og integrasjoner for mer om dette.  

I leksjon 3 tar vi for oss i større detalj hvordan en data scientist jobber, og etter hvert finner svarene som ligger gjemt i dataene.