BOIKOTT ISRAEL!

Ser både trusler og muligheter med kunstig intelligens

Intervju med Erik Bolstad, sjefredaktør i Store norske leksikon

Tekst Madhill Illustrasjon Beth Madeley

Erik Bolstad, sjefredaktør i Store norske leksikon, etterlyser KI-debatt i Norge.

Innen epistemologi, eller kunnskapsteori, står ideen om en verdikjede fra data til informasjon og videre til kunnskap og visdom sentralt. Først gjennom en raffinering av usorterte rådata fra verden til fakta og velbegrunnede teorier kan vi tilegne oss kunnskap.

I denne historiske prosessen med røtter tilbake til opplysningstiden har leksikon og oppslagsverk spilt en sentral rolle som bærer av kunnskap og fakta. Men hva skjer når store språkmodeller overtar rollen som den mest effektive måte å tilegne seg kunnskap? Eller i hvert fall et raskt og tilsynelatende godt svar på et spørsmål.

– Man har snakket om kunstig intelligens så lenge jeg har jobbet med IT, men det var først med lanseringen av ChatGPT at jeg fikk følelsen av noe intelligent, selv om det raskt viste seg å ikke være det. Spesielt for oss som er opptatt av formidling og utvikling av norsk fagspråk er det morsomt å se at det er først når maskinene blir gode til å skrive at vi opplever de som reelt intelligente og reflekterte, sannsynligvis fordi språket og kunnskapen er tett sammenvevd, sier Erik Bolstad, sjefredaktør i Store norske leksikon (SNL).

Bolstad er opprinnelig journalist, og studerte medievitenskap og statsvitenskap ved Universitetet i Oslo. Han utviklet værtjenesten yr.no for NRK i 2007 og var senere redaksjonssjef for NRKbeta, NRK TV og NRK Radio. I august 2015 ble han kommunikasjonssjef og redaktør i SNL og overtok stillingen som sjefredaktør da Anne Marit Godal sluttet i november 2016.

Et begrep i endring
Han mener begrepet og forståelsen av kunstig intelligens er i stadig endring.
– Over årene har jeg utviklet enorme mengder med automatiserte scripts som blant annet styrer arbeidslister, men jeg har aldri sett på det som kunstig intelligens. Samtidig vet jeg at man fint kunne ha kalt slike scripts kunstig intelligens, inntil de store språkmodellene redefinerte hva vi legger i begrepet.

– Et annet eksempel er NTB sin tjeneste for automatisk genererte fotballnyheter basert på kampstatistikk. Tjenesten var noe man uten tvil kunne ha kalt KI på den tiden, men som i dag ikke vil fremstå som det. Kunstig intelligens er et begrep i endring, sier Bolstad.

Mange bruksområder
Selv om han ser fordeler med KI, har leksikonet et absolutt forbud mot å publisere KI-generert tekst.
– Forbudet kom som en respons på at det er lett at det sniker seg inn feil i KI-genererte tekster. Samtidig vet vi som jobber mye med tekst at «teksten fanger», og om det er noe man ikke er helt sikker på, er det lettere å la det stå enn å slette eller rette. Når det er sagt bruker vi ulike KI-verktøy til artikkelevaluering og kvalitetssikring.

Bolstad forteller om flere fordeler med bruk av KI i arbeidet med å vedlikeholde og oppdatere leksikonet.
– Som redaktør for alle språkfamiliene i verden fikk jeg tilsendt en tekst om det engelske språket. Teksten jeg redigerte begynte med historien, utbredelsen, fonologien, grammatikken og andre fakta om det engelske språket. En helt grei tekst.

– Men for å kvalitetssikre teksten spurte jeg ChatGPT om den hadde forslag til forbedringer, hvorpå den gjorde meg oppmerksom på at teksten manglet informasjon om det engelske språkets rolle innen IT, musikk, film og populærkultur, aspekter jeg ikke hadde tenkt på. Man skulle tro at jeg som jobber med tekst ikke blir «fanget» av den, men det blir jeg fortsatt.
Selv om han ser at bruken av kunstig intelligens skaper fallgruver, mener han språkmodellene skaper nye og spennende muligheter.

– Vi har utviklet verktøy for å oppdage aspekter vi kan ha glemt og tester verktøy for å gjøre kjedelige oppgaver, eksempelvis søk på «Hvilke personer i Norske kunstnerleksikon er også omtalt i Store norske leksikon». I tillegg bruker vi KI til research og til å avdekke KI-generert innhold. For slike oppgaver er KI blitt veldig bra, sier han.

Mistet 25 prosent av trafikken til Google autosvar
Google Gemini autosvar, det KI-genererte oppslaget øverst på et Google-søk, ble lansert i slutten av mai, noe SNL merket gjennom et umiddelbart fall i besøkstall.
– Fallet skjedde samme dagen Gemini autosvar ble lansert og har holdt seg stabilt med en nedgang i trafikk på mellom 21 og 28 prosent. Samtidig er det dessverre mye bevistløs bruk av autosvar siden mange ikke vet hva det er. Mange tror at lenkene som blir oppgitt er troverdige kilder og at teksten er et sammendrag av kildene, men det er det ikke. Det er en tekst som er generert fra bunnen med lenker eller lesetips, uten at innholdet nødvendigvis kommer derfra. Det vil si at svaret har alle ulempene som kommer med store språkmodeller, inkludert hallusinering og formidling og forsterking av myter, propaganda og faktiske feil.

Bolstad mener det er tankevekkende at det ikke er mer debatt om dette i Europa.
– Da Google Gemini autosvar kom i USA for et år siden holdt hele nettet på å le seg i hjel av at den anbefalte å bruke lim for å holde osten på pizzaen, og at det er sunt å spise en gråstein om dagen. Nå er autosvar lansert i Norge, og folk tror fortsatt at svarene er til å stole på, sier Bolstad oppgitt.

Juridisk nøtt
Han peker på et upløyd juridisk landskap og mener lovligheten ved innhentingen av data til treningen av språkmodellene er tvilsom.
– Google har tjent ufattelig med penger på å indeksere internett, som de etter norsk lovhjemmel ikke har grunnlag for. Jon Bing skrev en artikkel om dette for veldig lenge siden hvor han sier at indeksering av internett må sees på som en midlertidig eksemplarfremstilling. Jeg mener det juridiske grunnlaget ikke holder.

– Da Google Gemini autosvar kom i USA for et år siden holdt hele nettet på å le seg i hjel av at den anbefalte å bruke lim for å holde osten på pizzaen […]. Nå er autosvar lansert i Norge, og folk tror fortsatt at svarene er til å stole på.

– Det er absurd at Google, i redselen for veksten til OpenAI og tap av markedsandeler, bruker innholdet, tatt på tvilsomt lovgrunnlag i mange år, som et våpen mot nettsidene de har tjent seg rike på. Det juridiske aspektet ved trening av språkmodeller er enormt.

– Samtidig kan alle be selskapene bak språkmodellene om å ikke bruke egenprodusert innhold til å trene modellene, men ingen bryr seg. Vi sendte flere slike meldinger i fjor, men de fleste selskapene ignorerte henvendelsen. Vi ser fortsatt at de laster ned hele nettsiden flere millioner ganger i året. Det er helt sykt.
Selv om det foreløpig ikke har vært opphavsrettslige søksmål mot selskapene bak språkmodellene i Norge, er det flere pågående rettsaker i USA.

– USA har et veldig annet utgangspunkt for opphavsrett enn oss. De har blant annet forbehold om såkalt «fair use», noe som ikke finnes i europeisk opphavsrett. I USA har indeksering av internett gått under «fair use», altså at det er til nytte for samfunnet og at det er rimelige at man kan gjøre det. Men når man går fra at det er rimelig med indeksering til at det er rimelig å bruke innholdet til å lage nytt innhold, blir det en dramatisk overgang, sier han.

Skolens rolle
Bolstad mener utdanningsinstitusjoner og skolevesenet har en fornuftig tilnærming til bruk av KI.
– Jeg mener skolen har gjort en god jobb med introduksjonen av KI og at lærerne er flinke til å snakke med elevene om det. Jeg mener også det er gjennomtenkt at man åpner for KI på noen eksamener. Siden elevene bruker KI uansett, er det bedre at de nå kan oppgi at de faktisk gjør det. Jeg mener det er bedre med åpenhet og diskusjon enn et forbud.

– Det står mer på foreldregenerasjon som ikke er forstår hva KI er. I dag har vi en generasjon som ikke skjønner hvor tilfeldige svarene fra en språkmodell er. Det er det største problemet, sier han.

Etterlyser samfunnsdebatt
Bolstad etterlyser en større samfunnsdebatt om hvordan KI påvirker oss.
– Jeg håper vi får en samfunnsdebatt om hva kunstig intelligens faktisk er. Først da kan vi snakke mer fornuftig og informert om utfordringer og muligheter. Jeg synes det er tankevekkende at den debatten ikke er tydeligere.

– Hvordan tror du kunstig intelligens vil utvikles videre?

– Jeg tror den raske utviklingen av ulike KI-verktøy vil fortsette i omtrent et år til. Som med annen ny teknologi vil utviklingen gå fort i tre år, før den stabiliseres og konsolideres. Det som blir spennende er hvor mye propaganda og falske nyheter som vil «tyte ut» før utviklingen er stabilisert. Det finnes allerede flere nettaviser hvor alt er KI-generert basert på ekte nyheter, men det er først når vi ser spredning av slike nyheter at det blir skummelt, avslutter Bolstad.

Torggata Blad er et kompromissløst uavhengig blad og nettmagasin – en humoristisk, systemkritisk og informativ utgivelse som sparker til venstre og høyre, oppover og nedover og midt i balla.

Pr. 2024 er Torggata Blad et forum for en fargerik forsamling av bidragsytere med varierende interesser og orientering. Det er en rar og forhåpentligvis skjærende stemme i koret av norske magasinutgivelser.

Torggata Blad ble grunnlagt i 2007 av
Bror Wyller (forfatter og lege)

Torggata Blad er støttet av: