Former for datamodellering

Former for datamodellering 

Vi introduserte datamodellering i leksjon 1 da vi så på hvordan værvarselet blir til, men la oss nå se på dette i litt mer detalj. Først, la oss se på to klassiske modelleringsoppgaver, nemlig klassifisering og regresjon.  

Ved klassifisering har man for eksempel samlet inn data om en banks kunder, deres betalingshistorikk og annen relevant informasjon, og bruker deretter dette til å trene en modell som prøver å predikere – altså forutse – om kunden kommer til å misligholde lånet sitt: ja eller nei. I dette eksempelet er det to grupper (ja og nei), men det er ingen begrensning på antall grupper i et klassifiseringsproblem.  

Ved regresjon kan man for eksempel bruke data om personers utdanning og jobberfaring til å predikere deres forventede lønn. Forskjellen er at i et klassifiseringsproblem prøver modellen å finne ut hvilken klasse en observasjon tilhører, mens i et regresjonsproblem finner modellen fram til et tall.