Det er historisk: For første gang har en stor språkmodell bestått Turing-testen. I skriftlige tester kan man ikke lenger skille mellom mennesker og kunstig intelligens.
Turing-testen, formulert av Alan Turing i 1950, er en test som på generelt grunnlag avgjør om en maskin kan tenke som et menneske. Testen foregår ved at en maskin fører en samtale med et menneske gjennom skrevet tekst. Paralellt fører personen en samtale med et annet menneske, uten å vite hvem som sitter i andre enden. Om personen ikke klarer å avgjøre om den prater med et menneske eller en maskin, har maskinen bestått testen.
I en nylig prepublisert studie ved Cornell Universitet satte forskere opp eksperimentet med fire ulike språkmodeller. ELIZA, GPT-4o, LLaMa-3.1-405B og GPT-4.5.
Les også: P-piller for menn snart en virkelighet
Deltakerne hadde fem minutters samtaler med både en AI og et ekte menneske – uten å vite hvem som var hvem – og skulle deretter gjette hvem som var menneskelig. Resultatene er interessante: GPT-4.5 ble oppfattet som det ekte mennesket i 73 % av tilfellene, altså oftere enn det faktiske mennesket. LLaMa-3.1 traff omtrent på 50/50, mens både ELIZA og GPT-4o skåret dårligere enn ren gjetting.

Dette er første gang noen faktisk kan si at en AI har bestått den klassiske Turing-testen, og det setter fart på diskusjonen om hva slags intelligens disse språkmodellene egentlig representerer – og hva det betyr for samfunnet.
Kunstig bevissthet?
Det store spørsmålet som stadig blir mer og mer relevant, er hvorvidt kunstig intelligens etterhvert kan ha en slags bevissthet, og hvordan vi i det hele tatt skulle kunne vite det, om det var tilfellet. I en annen ferskt forsøk gjorde selskapet Anthropic et forsøk på å bedre forstå hvordan store språkmodeller fungerer. For utrolig nok, er store språkmodeller en av de teknologiene som er lansert på global skala, som man forstår minst av.
Med en teknikk kalt «circuit tracing» eller kretssporing, fulgte forskerne med på hvordan en KI faktisk kommer fram til svarene – steg for steg, omtrent som å følge ledningene i en hjerne. I praksis kobler man sammen ulike komponenter i modellen og ser hvordan informasjonen flyter internt.
Circuit Tracing
Anthropic brukte teknikken for å kikke under panseret på språkmodellen Claude, og det de fant er både fascinerende og litt creepy: Modellen brukte noen merkelige, til tider helt umenneskelige strategier for å komme fram til riktig svar – strategier den selv nektet for når den ble spurt direkte. Med andre ord: KI-en visste ikke alltid hvorfor den gjorde det den gjorde.
Forskerne spurte Claude: «Hva er det motsatte av ‘liten’?» på ulike språk. Og selv om man skulle tro at modellen hadde egne moduler for forskjellige språk, er ikke det tilfellet. I stedet finner den først ut svaret på et slags språkfritt nivå, noe à la “noe som har med størrelse eller storhet å gjøre”, og deretter oversetter den konseptet til riktig språk. Altså kommer betydningen først og ordene etterpå. Det antyder at modellen tenker i en slags intern, abstrakt semantikk før den kler tanken i språk.
Store språkmodeller som ChatGPT og Claude er trent på gigantiske mengder data og på et tidspunkt blir det nærmest umulig å vite hvordan språkmodellen ser ut på innsiden. Det at modellene ikke bare regner ut sannsynligheten på hva som bør være neste ord, men istedet legger en betydning i selve tingene den snakker om, gjør den på noen måter litt mer menneskelig.
Kanskje er det en slags bevissthet vi ser konturene av. Det ville uansett være helt umulig å avgjøre. I det hele tatt kan vi per definisjon ikke si noe som helst om bevisstheten til noe annet vesen enn oss selv. Bevisstheten er subjektiv.
Uansett, etterhvert som kunstig intelligens blir smartere enn oss, spiller det kanskje ikke så mye rolle, hvorvidt den har bevissthet eller ikke. Resultatet blir det samme, så lenge den oppfører seg som et intelligens vesen. At kunstig intelligens kan komme til å ta over styringen, virker mer og mer plausibelt. Og allerede lar vi oss i stor grad styre av maskiner og deres algoritmer. En bestått Turing-test markerer slutten på verden slik vi kjenner den.