Kinesisk språkmodell ryster tech-bransjen 

Foto: Photo Solen Feyissa / Unsplash

Er DeepSeeks R1 billigere, bedre og mer effektiv enn sine amerikanske motparter? Les mer om dette og resten av ukens tech-nyheter i Bits & Bytes. 

Den kinesiske språkmodellen DeepSeek har den siste uken snudd opp ned på teknologiverdenen. Det har blitt kalt for et «Sputnik-øyeblikk», likt romkappløpet mellom USA og Sovjetunionen. 

På et tidspunkt stupte amerikanske tech-aksjer. Eksperter kaller DeepSeek for et granatatsjokk, mens andre advarer mot å laste den ned. 

Men hva er egentlig DeepSeek – og hva har det å si for deg? 

Koster bare en brøkdel av rivalenes teknologi

Du som følger Bits & Bytes tett, husker kanskje at vi først skrev om DeepSeek for flere måneder siden

Da betaversjonen ble lansert, hevdet DeepSeek at R1-modellen kunne «resonnere» – det vil si etterligne menneskelig logikk og faktasjekke egne svar. De påsto også at den presterte bedre enn mer etablerte språkmodeller på anerkjente tester.

Denne uken ble R1 lansert for allmennheten, og skjøt raskt til topplisten over de mest nedlastede appene til iPhone i mer enn 50 land. 

Ikke bare er den gratis i bruk. Den kostet bare en brøkdel av budsjettene og bruker langt mindre regnekraft sammenlignet med sine amerikanske motparter. 

Mens OpenAI, Anthropic, Google, Meta og Microsoft til sammen har brukt milliarder av dollar på å utvikle språkmodellteknologi, kostet visstnok R1 «bare» 6 millioner dollar å trene

– Når det viser seg at KI-modellane ikke trenger å være i nærheten så store som en har trodd, så trenger en ikke like mange prosessorer, sier KI-forskar Inga Strümke ved NTNU til NRK

Hun mener dette forklarer det kraftige børsfallet, der spesielt Nvidia opplevde en dramatisk nedgang. Selskapets børsverdi falt med nærmere 600 milliarder dollar. Det er det største verdifallet på Wall Street noen gang, ifølge Bloomberg

Nvidia er ledende innen utvikling av databrikker, som er avgjørende for å trene og drive kunstig intelligens. Dette har gjort selskapet til en av de viktigste aktørene i KI-industrien.

Åpen kildekode

Det som muligens har rystet børsen aller mest, handler imidlertid om at DeepSeek utvikler teknologi med åpen kildekode. 

Dette innebærer at andre kan bygge egne tjenester på toppen av språkmodellen. Tidligere Intel-CEO, Pat Gelsinger, har allerede byttet ut OpenAI med DeepSeek i sin nye startup. 

DeepSeeks modeller er imidlertid ikke fullt ut åpne kildekode, skriver Vox. Det er noe som kalles open-weight-modeller, noe som betyr at vektene – dataene som gjør det mulig for modellen å generere innhold – er offentlig tilgjengelige. De har ikke offentliggjort treningsdata eller algoritmer. 

Sensurerer sensitive temaer

Så DeepSeek er billigere, bedre, kraftigere, mer anvendelig og effektiv – eller? 

Som kjent pleier det å være en del rabalder når Kina lanserer tjenester som på en eller annen måte har med data og kommunikasjon å gjøre. 

Det viser seg for eksempel at R1 nekter å svare på spørsmål som kan sette Kina i et dårlig lys. For eksempel unngår den spørsmål om presidenten i Kina eller temaer som har med Taiwan å gjøre. 

Som om ikke det er nok, anklager OpenAI kineserne for å ha ulovlig trent på deres modeller

Betyr dette at Kina har tatt igjen USA innen KI? Utviklingen kommer nok uansett til å fortsette i et rivende tempo også i tiden fremover. 

Her har vi samlet de viktigste nyhetene innen teknologi, kunstig intelligens og sikkerhet fra den siste uken: 

Mer om DeepSeek

KI-nyheter fra den siste uka 

Sosiale medier 

Cybersikkerhet

Robotikk

Brikkekrigen

Politikk

Diverse