Nå kan kunstig intelligens kopiere stemmen din

Ny «stemmekloner» fra Microsoft kan simulere og manipulere stemmer til å si hva som helst. Men forskerne er selv klar over at den kan misbrukes. Her er en oppsummering av tech-uken som gikk:

Bits & Bytes

fre. 13. jan. 2023

Alle snakker om kunstig intelligens. Det skulle bare mangle at kunstig intelligens begynte å snakke selv!

Nå har nemlig Microsoft-forskere annonsert en tekst-til-tale-modell som kan simulere stemmer. Teknologien kalles for VALL-E, og med tilgang på lydklipp ned til tre sekunder skal den kunne produsere troverdige gjengivelser av stemmer modellen fôres med.

Dette er ikke det første eksempelet på syntetisk stemmegjengivelse, eller «digital stemmekloning» om du vil. Men der lignende modeller tidligere har vært avhengig av store prøvestørrelser og svært høy datakvalitet – i tillegg til at resultatene har vært så som så – er VALL-E mye mer presis.

Grunnen skal være at den manipulerer bølgeformer og bruker treningsdata fra et lydbibliotek med over 60.000 timer med engelskspråklig tale (vi må nok regne med at modellen foreløpig ikke fungerer like godt på norsk). Dette biblioteket som VALL-E er bygget på, kalt EnCodec, er utviklet av Meta (som i Facebook).

Jobber parallelt med en gjenkjenningsmodell som skal avsløre misbruk

Den syntetiske simulasjonen tar også hensyn til tonefall, klang og miljøet rundt. Gis den tilgang til en telefonsamtale, vil gjenskapningen komme med telefonlyd. Ikke minst kan innholdet i det «stemmen» sier forandres basert på et manus.

Slik kan et utdrag av en tale fra Jonas Gahr Støre om strømpriser manipuleres til å handle om helsegevinsten av å spise meitemark. Eventuelt noe mye mer kontroversielt.

VALL-E føyer seg inn i rekken av ny kunstig intelligent teknologi som på en eller annen måte utfordrer det vi mennesker har sett på som ekte.

DALL-E og Midjourney genererer kunstverk, illustrasjoner og i blant skremmende realistiske bilder. ChatGPT og andre språkmodeller kan produsere setninger og hele artikler det nesten er umulig å skille fra menneskeskrevet tekst. Syntetiske medier og manipulering av videoer og bilder ved hjelp av maskinlæring – såkalte deepfakes – er en teknologi som blir stadig mer sofistikert.

I feil hender kan disse teknologiene misbrukes til å villede, til svindel og for å produsere falske nyheter. Nettopp derfor har Microsoft ventet med å gjøre VALL-E åpent tilgjengelig for offentligheten. Inntil videre jobber forskerne parallelt med en gjenkjenningsmodell som skal kunne avgjøre om et lydklipp er syntetisk produsert eller reelt.

Vår reaksjon på VALL-E er den samme som ved mye annet vi ser av ny maksinlæringsteknologi: Spennende! Men også skremmende!

(Artikkelen fortsetter nedenfor)

Vil du lære mer om kunstig intelligens? Ta vår veiviser – gratis:

Tech-verden er ikke ferdig med ChatGPT

ChatGPT er stadig i vinden. Mens norske skoleelever får den kunstig intelligente språkmodellen til å skrive historiestiler for de (og belønnes med gode karakterer), planlegger Microsoft å implementere ChatGPT i Bing for å konkurrere med Google.

Les mer om hva som har skjedd med vår alles favoritt-KI-greie den siste uken:

Microsoft og OpenAI jobber sammen med å implementere ChatGPT i Bing for å utfordre Google (Theinformation.com)
OpenAI kan bli verdsatt til 29 millarder dollar (Siliconangle.com)
Medlemmer i forum for cyberkriminalitet bruker ChatGPT for å produsere skadevare (arstechnica.com)
ChatGPT skrev skoleoppgaven min (MagasinE)
Microsoft planlegger å investere 10 millarder dollar i OpenAI (CNBC)

Les også

Se ogsåChatGPT: Slik utfordrer teknologien skole, forskning – og søk

Uken som har gått i cybersikkerhet

De fleste av oss har lært å unngå passord som Qwerty, 123456789 eller bursdagen til hunden din. Men selv med de mest intrikate formuleringer kan ditt passord utgjøre en sikkerhetsrisiko for deg. Særlig om du bruker det samme passordet til flere innlogginger.

Nylig ble 18 000 personlige passord lekket i et dataangrep mot TV2. Og selv ikke de som benytter seg av såkalte passordbehandlere (verktøy som på ulike måter lagrer og administrerer passord og innlogginger) kan være helt trygge: Rett før jul ble populære LastPass offer for et enormt databrudd. Det samme har Slack og CircleCI.

Tips: Her kan du sjekke om din e-post har vært en del av et databrudd. Sannsynligheten er nemlig stor for at den på en eller annen måte er lekket.

Les mer om ukas cybersikkerhetsyheter her:

Ansiktsgjenkjenning skal avsløre brudd på hijab-lover

Internett stenges under eksamen på norske skoler på grunn av kunstig intelligens. I Iran skal teknologi for ansiktsgjenkjenning avsløre brudd på hijab-lover. Og over 4000 mennesker har helt uten å vite det mottatt terapeutisk hjelp av en kunstig intelligent språkmodell.

Les mer om dette og andre KI-nyheter her:

I underholdningsbransjen har mennesker tenkt som kunstige intelligenser i flere tiår (Morgenbladet)
Eksperimenterte med kunstig intelligens i behandling av mental helse uten samtykke (arstechnica.com)
Iran sier at ansiktsgjenkjenning vil identifisere kvinner som bryter hijab-lovene (WIRED)
Internett stenges for elever under eksamen på grunn av kunstig intelligens (Aftenposten)

Slutt for SlettMeg

SlettMeg fases ut og MyGame skaper kontroverser i breddeidretten. Og en ny dom gir deg rett til å vite identiteten til dem dataene dine blir delt med – noe du kan takke en helt vanlig østerriker som skulle sende et brev for! Les mer om dette her:

Hjelpetjenesten SlettMeg har stanset arbeidet (NRK)
Svært problematisk filming av ungdom - Kommentar - Tek.no (Tek.no)
Fersk dom: Du har rett til å vite identiteten til dem dataene dine blir delt med (Digi.no)
Europa slår ned på TikTok (Politico.eu)

Relaterte innhold

Bits & BytesEr du klar for å vibbekode litt i sommer? FRE. 27.06.2025

Bits & BytesSpråkmodeller kan «resonnere» og «huske» – men kan de lære? FRE. 20.06.2025

Bits & BytesNå er «KI-milliarden» her – men ikke alle er fornøyde FRE. 13.06.2025

Bits & BytesEquinor: – Norge kan bli verdensledende på KI FRE. 06.06.2025