Nå kan kunstig intelligens kopiere stemmen din 

Illustrasjon av DALL-E

Ny «stemmekloner» fra Microsoft kan simulere og manipulere stemmer til å si hva som helst. Men forskerne er selv klar over at den kan misbrukes. Her er en oppsummering av tech-uken som gikk: 

Alle snakker om kunstig intelligens. Det skulle bare mangle at kunstig intelligens begynte å snakke selv! 

Nå har nemlig Microsoft-forskere annonsert en tekst-til-tale-modell som kan simulere stemmer. Teknologien kalles for VALL-E, og med tilgang på lydklipp ned til tre sekunder skal den kunne produsere troverdige gjengivelser av stemmer modellen fôres med. 

Dette er ikke det første eksempelet på syntetisk stemmegjengivelse, eller «digital stemmekloning» om du vil. Men der lignende modeller tidligere har vært avhengig av store prøvestørrelser og svært høy datakvalitet – i tillegg til at resultatene har vært så som så – er VALL-E mye mer presis. 

Grunnen skal være at den manipulerer bølgeformer og bruker treningsdata fra et lydbibliotek med over 60.000 timer med engelskspråklig tale (vi må nok regne med at modellen foreløpig ikke fungerer like godt på norsk). Dette biblioteket som VALL-E er bygget på, kalt EnCodec, er utviklet av Meta (som i Facebook).

Jobber parallelt med en gjenkjenningsmodell som skal avsløre misbruk 

Den syntetiske simulasjonen tar også hensyn til tonefall, klang og miljøet rundt. Gis den tilgang til en telefonsamtale, vil gjenskapningen komme med telefonlyd. Ikke minst kan innholdet i det «stemmen» sier forandres basert på et manus. 

Slik kan et utdrag av en tale fra Jonas Gahr Støre om strømpriser manipuleres til å handle om helsegevinsten av å spise meitemark. Eventuelt noe mye mer kontroversielt. 

VALL-E føyer seg inn i rekken av ny kunstig intelligent teknologi som på en eller annen måte utfordrer det vi mennesker har sett på som ekte.

DALL-E og Midjourney genererer kunstverk, illustrasjoner og i blant skremmende realistiske bilder. ChatGPT og andre språkmodeller kan produsere setninger og hele artikler det nesten er umulig å skille fra menneskeskrevet tekst. Syntetiske medier og manipulering av videoer og bilder ved hjelp av maskinlæring – såkalte deepfakes – er en teknologi som blir stadig mer sofistikert. 

I feil hender kan disse teknologiene misbrukes til å villede, til svindel og for å produsere falske nyheter. Nettopp derfor har Microsoft ventet med å gjøre VALL-E åpent tilgjengelig for offentligheten. Inntil videre jobber forskerne parallelt med en gjenkjenningsmodell som skal kunne avgjøre om et lydklipp er syntetisk produsert eller reelt. 

Vår reaksjon på VALL-E er den samme som ved mye annet vi ser av ny maksinlæringsteknologi: Spennende! Men også skremmende!

(Artikkelen fortsetter nedenfor)

Vil du lære mer om kunstig intelligens? Ta vår veiviser – gratis:

Veiviser

Kunstig intelligens på arbeidsplassen

KI endrer hvordan vi lever og jobber. Lær om mulighetene med teknologien – samt hvordan og hvorfor vi alle må bidra til å styre utviklingen i etisk og ansvarlig retning.

4 Moduler0% Fullført

Tech-verden er ikke ferdig med ChatGPT

ChatGPT er stadig i vinden. Mens norske skoleelever får den kunstig intelligente språkmodellen til å skrive historiestiler for de (og belønnes med gode karakterer), planlegger Microsoft å implementere ChatGPT i Bing for å konkurrere med Google. 

Les mer om hva som har skjedd med vår alles favoritt-KI-greie den siste uken: 

Uken som har gått i cybersikkerhet

De fleste av oss har lært å unngå passord som Qwerty, 123456789 eller bursdagen til hunden din. Men selv med de mest intrikate formuleringer kan ditt passord utgjøre en sikkerhetsrisiko for deg. Særlig om du bruker det samme passordet til flere innlogginger. 

Nylig ble 18 000 personlige passord lekket i et dataangrep mot TV2. Og selv ikke de som benytter seg av såkalte passordbehandlere (verktøy som på ulike måter lagrer og administrerer passord og innlogginger) kan være helt trygge: Rett før jul ble populære LastPass offer for et enormt databrudd. Det samme har Slack og CircleCI. 

Tips: Her kan du sjekke om din e-post har vært en del av et databrudd. Sannsynligheten er nemlig stor for at den på en eller annen måte er lekket. 

Les mer om ukas cybersikkerhetsyheter her:  

Ansiktsgjenkjenning skal avsløre brudd på hijab-lover

Internett stenges under eksamen på norske skoler på grunn av kunstig intelligens. I Iran skal teknologi for ansiktsgjenkjenning avsløre brudd på hijab-lover. Og over 4000 mennesker har helt uten å vite det mottatt terapeutisk hjelp av en kunstig intelligent språkmodell. 

Les mer om dette og andre KI-nyheter her: 

Slutt for SlettMeg 

SlettMeg fases ut og MyGame skaper kontroverser i breddeidretten. Og en ny dom gir deg rett til å vite identiteten til dem dataene dine blir delt med – noe du kan takke en helt vanlig østerriker som skulle sende et brev for! Les mer om dette her: