Ga Claude Code «ADHD» – hevder den ble dobbelt så bra

Hva skjer når en KI-agent får beskjed om å tenke litt mindre rett fram? Les mer om dette og ukens tech-nyheter i ukens Bits & Bytes.

Av Redaksjonen

Utviklingen av kunstig intelligens har siden starten vært inspirert av hvordan den menneskelige hjernen fungerer: Fra dyp læring og nevrale nettverk til språkmodeller som resonnerer.

Men ikke alle hjerner fungerer på samme måte. Heldigvis, kan man si. Mange av de mest interessante bidragene innen forskning, kultur og samfunnsdebatt har nemlig kommet fra folk med atypiske tankemønstre.

Men hva skjer om man også gir kunstig intelligens egenskaper som lar den «tenke» litt annerledes?

Denne uken publiserte akademikeren Udit Akhouri et tredjepartsverktøy som, litt tabloid sagt, gir Claude Code en diagnose.

– Jeg ga Claude Code ADHD. Og nå tenker den dobbelt så bra, skriver han i en post på Reddit.

Låser seg ikke til første svar

I praksis er det snakk om en såkalt skill – et tillegg man kan knytte til agenter for å gi dem konkrete ferdigheter, som Claude kan hente fram når oppgaven passer.

Ifølge tech-nettstedet The New Stack handler akkurat denne skillen – som har fått mye oppmerksomhet på GitHub – om å jobbe mindre lineært med problemer, men heller raskt undersøke flere separate tankespor samtidig.

Litt slik personer med ADHD tenker, med andre ord.

Sammen med verktøyet har Akhouri publisert en rapport der han skriver at denne måten å jobbe med KI-agenter kan hindre at de låser seg til det første plausible svaret.

Det er et kjent problem at mange KI-fallgruver handler om at modeller tidlig jobber seg inn i et skjevt spor, som gir resten av resultatet samme slagside.

– Jeg forsker på KI-sikkerhet innen helse og livsvitenskap. Da jeg brukte Claude Code til å resonnere rundt noen ulike problemer, la jeg merke til et mønster: Claude, og egentlig KI-agenter generelt, jobber veldig lineært. Det finnes en god forklaring på det. Nesten alle språkmodeller fra 2024 følger en chain-of-thought-logikk, der KI-en går dypt i én retning om gangen, skriver han på Reddit.

– ADHD (verktøyet, red. anm) sprer parallelle tankespor under ulike kognitive rammer, vurderer dem, kutter fellene og går dypere i de beste, skriver Akhouri videre i rapporten.

Bedre til research enn koding

Ifølge Akhouri er skillen nyttig når det kommer til idémyldring og planlegging, men ikke til koding. Mer presist beskriver han det som et resonnerings- og planleggingslag for KI-agenter.

– Det er ikke laget for å skrive kode raskere, men å støtte arkitekturvalg og research før kode skrives, sier han til The New Stack.

For tynt grunnlag?

Når det kommer til påstanden om at Claude Code med ADHD tenker «dobbelt så bra», legger ikke Akhouri skjul på at dette er en relativt liten test i sin egen rapport på GitHub.

Der har han sammenlignet ADHD-verktøyet med en vanlig énspors-agent på seks åpne ingeniørproblemer. I fem av seks tilfeller fiik ADHD-agenten den beste scoren.

Som forventet godtar ikke alle at noe er dobbelt så produktivt på et så tynt grunnlag. Noe Ramos, visepresident for KI-operasjoner i Agiloft, sier til The New Stack:

– Uten dokumentert samsvar mellom vurdererne er gevinstene på områder som felleoppdagelse og originalitet interessante, men foreløpig for usikre til å kalles robuste funn. «Dobbelt så bra»-påstanden trenger mer enn seks problemer å lene seg på.

Er det egentlig nytt?

Det er heller ikke alle som mener dette er noe nytt under solen.

– Jeg synes ikke det er direkte nytt som agent-mønster. Det ser ut som en velkjent strategi for parallell uttrekking og utvelgelse, men pakket inn på en interessant måte for ingeniørbeslutninger.

Det er med andre ord ikke snakk om noen ny beste praksis her – men akkurat slik det generelt i arbeidslivet ikke akkurat skader å tenke litt utenfor vante baner, så kan kanskje det samme gjelde med kunstig intelligens?

Hvem vet, kanskje man skulle gjort som startupen Repowire, og jobbet med å bygge ADHD inn i stacken?

Det har skjedd mye annet spennende innen teknologi, kunstig intelligens, sikkerhet og digitalisering generelt den siste uken. Her har vi oppsummert det viktigste:

Som vanlig (altfor?) masse om KI:

Heldigvis litt om sikkerhet og forsvar:

Hete takes på energi og datasentre:

Dystert om barn på nett:

Roboter og boter, hånd i hånd:

Og litt godt og blandet til slutt: