En glassball med tegn

På hvilken måte er ChatGPT intelligent? (Tekstutgaven)

Den 30. november 2022 gjorde firmaet OpenAI chatboten ChatGPT gratis tilgjengelig på nett. Du kunne registrere deg på chat.openai.com og så hadde du til full tilgang til den mest avanserte chatboten som var tilgjengelig på markedet. ChatGPT ble den raskest voksende tjenesten noensinne på Internett og den vokser stadig.

Det første de fleste tenker etter å ha prøvd ChatGPT litt er «Den skriver jo like godt som meg på en god dag, og mye raskere!». Etter å ha arbeidet mer med ChatGPT endres det til «Jeg skriver bedre, men det er greit å ha som utgangspunkt.», og så til «Her står det helt feil ting om det jeg spurte om.» Så hvordan kan ChatGPT både skrive så bra og smart, og samtidig så feil om verden? På hvilken måte er ChatGPT intelligent?

Hva er kunstig intelligens?

ChatGPT er en kunstig intelligens i form av en stor språkmodell – large language model (LLM). Det er sagt mye forskjellig om hva ChatGPT kan og ikke kan. Noe av det er riktig observert, og noe er forklart feil eller uklart. Vi må forstå hva en LLM er og hva den kan (og ikke kan) for å kunne vite hvordan vi skal forholde oss godt til bruk av ChatGPT i skolen.

Kunstig intelligens er en form for datateknologi som gir maskiner evnen til å utføre oppgaver som normalt krever menneskelig intelligens, som å lære, å resonere og å forstå. Det kan være alt fra å gjenkjenne tale og bilder, til å løse komplekse problemer og å utføre oppgaver som krever aktiv læring. AI er delt inn i to hovedkategorier – kunstig generell intelligens (AGI) og kunstig spesialisert intelligens (ASI). AGI er det at maskiner har evnen til å løse et bredt spekter av oppgaver som oss mennesker, mens ASI referer til en AI som en spesialisert til å utføre én bestemt oppgave. Det er ulike ASI-er vi møter i dag, mens AGI enda er langt frem (om overhode mulig).

En av de vanligste måtene en AI lærer på er ved å la den trene, eller analysere, en enorm mengde data og gjennom det utvikle en modell for å gjenkjenne mønstre, og så ut fra det kunne forutsi resultater. Det er dette ChatGPT har gjort, og den har trent på tekst og kan forutsi fortsettelsen av en tekst.

Hvordan er ChatGPT trent og hva er det den gjør?

GPT v3.5, som ChatGPT bygger på, er en LLM vi vet mye om, siden OpenAI har offentliggjort mye av arbeidet med den. GPT er trent på rundt 500 milliarder stavelser, hentet fra ulike filtrerte kilder. På samme måte som en kalkulator ikke har lagret alle tall den kan vise har heller ikke GPT (eller andre maskinlærte AI-er) lagret noe av informasjonen den er trent på, i dette tilfelle teksten. Det «eneste» GPT kjenner til er rundt 55 000 stavelser som den har koblet sammen på 175 milliarder forskjellige måter. På samme måten som kalkulatoren har algoritmer for hva den skal vise, alt etter hvilke knapper vi trykker på, har GPT en modell (algoritme) for hvilke stavelser den skal vise, alt etter hvilke stavelser vi gir den til å begynne med. Det er det den «kan».

Her kommer en overforenklet forklaring på hva GPT gjør når den svarer deg. Alle AI-er har et «operativsystem», et system som snakker med omverden og modellen til AI-en. Til venstre er treningsgrunnlaget for GPT, i midten er operativsystemet og til høyre er den kommende språkmodellen.

En modell av AI før trening.

Treningen begynner og det bygges opp vektede forbindelser mellom de 55 000 stavelsene som er i GPT-modellen, og det er som nevnt 175 milliarder av dem. Det danner seg «områder» hvor GPT er flink til vite hvordan stavelser henger sammen ut fra hva den er trent på, som for eksempel samtaler, eventyr, oppskrifter og oversettelser. Treningen tar lang tid og koster mange penger, i form av regnekraft på kraftige datamaskiner. Om du skal gjøre endringer i modellen, må den trenes opp helt på nytt. GPT oppdateres ikke fortløpende.

Et bilde av en AI som trener og bygger opp modellen.

Når treningen er ferdig kan du gi GPT ledetekster (som er den norske oversettelsen av begrepet prompt), som er det startpunktet du ønsker at modellen skal begynne å jobbe med. Hvis du gir GPT ledeteksten «Once upon a time» vil disse stavelsene sendes inn i modellen og bli fraktet inn og ut av modellen med en ekstra stavelse lagt til i hver runde. Vi kan nesten si at ledeteksten «Once upon a time» er et slag program som startes i modellen, og modellen vet hvordan programmet skal kjøres og produserer teksten til et helt eventyr som en naturlig forlengelse av ledeteksten.

Ferdig trent AI jobber med en ledetekst.

Det OpenAI ønsket å prøve ut med GPT v3 var å se hva som skjedde når de trente den mye – når det ble milliarder av koblinger. Det viste seg at GPT da hadde trent seg opp til å lage koblinger mellom områdene som den var trent på, altså at den koblet sammen ting den ikke direkte var trent på. Den ble også rågod på å vite hva en ledetekst burde føre til uten å få et eksempel først. GPT v3 kunne plutselig oversette en samtale om hvordan en oppskrift på et eventyr skulle skrives, uten at du viser den hvordan den skal gjøre det.

Dette er som sagt en grov overforenkling, som alle forenklinger er, og de som vil lese mer kan ta for seg denne PDFen fra de som har laget GPT-modellen.

Ut fra det som er forklart nå er det viktig å huske at ChatGPT ikke har lagret noe av teksten den er trent på. Den vet ikke en gang hva den er trent på, fordi den «vet» ingenting om verden. Den kan bare språk. Det betyr at uansett hva den skriver, så vet den ikke om kilder, den har ingen meninger, ingen faktabase den henter noe fra, kan ikke endre mening eller rette feil. Det eneste den kan gjøre er å fortsette neste stavelse på de stavelsene som kjøres inn i modellen. Det er likevel lett å tro at ChatGPT mener noe, fordi den er så god til å skrive tekst vi leser som meningsfull og derfor skrevet av en aktør.

Så hvis du leser at ChatGPT søker gjennom millioner av nettsider eller kan vurdere og sette karakter på elevtekster, så kan den ikke det. Den vil likevel forsøke å komme opp med hva som er naturlig å skrive videre som svar på det du legger inn som ledetekst. Hvis du skriver inn «Vurder denne teksten med en karakter.» vil ChatGPT finne noe den vet er naturlig å skrive som respons på ledeteksten. Men den mener ikke noe om teksten som en aktør av den grunn. Den sammenlikner teksten ikke opp mot noe. Den har ingen erfaring eller minne om hva som er en dårlig tekst eller hva som er en god tekst. Den vil likevel skrive et svar som setter en karakter på teksten, fordi det er det som er det naturlige å skrive som svar på ledeteksten du ga den.

Sagt på en annen måte – ChatGPT er en vanvittig flink utgave av den eleven læreplanen ikke vil ha! Den kan ingenting annet enn å skrive det den forventer at vi forventer at den skal skrive når vi gir den et utgangspunkt / en ledetekst. Det er derfor ChatGPT kan svare godt på eksamensoppgaver.

ChatGPT (og andre LLMer) i skolen

Det vanskelige først

GDPR og personvern

Bruk av kunstig intelligens kommer med mange personvernutfordringer. De fleste er knyttet til at LLMer trenger enorme datamengder å trene på, og de som lager LLMene vil prøve å skaffe seg mest og best mulig data å trene LLMen videre med. For ChatGPT sin del er det en utfordring hvis skoler tar i bruk gratistjenesten som ble tilgjengelig 30. november 2022. chat.openai.com er en brukertjeneste hvor brukeren må registrere seg med en gyldig epostadresse og logge på med denne for å kunne bruke tjenesten. Alt du legger inn, og får som svar, vil bli brukt av OpenAI til å trene GPT videre. Alt er beskrevet i Terms of Use og Privacy Policy. Du kan derfor ikke legge inn elevarbeider/andres personopplysninger eller kreve at elevene bruker tjenesten. OPPDATERING 30/4-23: Dette er nå mulig å skru av, og ChatGPT er for sin del et steg nærmere en løsning for utdanning.

Det er også viktig å være klar over at alle AI-tjenester bruker store mengder datakraft, så det finnes ingen gratis tjenester. Du betaler enten med penger, informasjon eller lojalitet. Hvis en skole velger å kjøpe tilgang til OpenAI sine tjenester via API (ikke via nettstedet ChatGPT) er det andre regler som gjelder, og OpenAI vil verken samle inn eller bruker noen av opplysningene som sendes til dem. Skolen må betale da for hver stavelse som blir produsert, fordi det er som sagt ikke gratis. Fordelen er at så godt som alle GDPR-utfordringer er løst.

Fusk og fanteri

Det er fusk-diskusjonen som har tatt mest plass i forbindelse med ChatGPT og utdanning. Fusk er bare fusk ut fra et gitt utgangspunkt. At ChatGPT alene kan gjøre det ok på en vurdering forteller en del om hvilket syn skolen har på kompetanse og læring. Kort fortalt har vi opp gjennom årene, også i barneskolen, gang på gang vist eleven at det å få til testen er viktigere enn å ha lært noe. Selv om vi sier til dem at det er viktig at de lærer ting, så er det først når de får til testen at vi «belønner» dem. Derfor fusker eleven. Test-/vurderingsregimet vi har må tilpasses, og det må tilpasses nå. Det er allerede for sent. En god forståelse av hva underveisvurdering er, slik Udir har beskrevet det, vil løse mange utfordringer i møte med ChatGPT. Eller som Inga Strümke sier det i NRKs «Drivkraft»-podcast (tid 07:58):

Det er synd at de [elevene] ser på seg selv som produsenter av tekst. Det er jo ikke det som er formålet med å få elever til å skrive. Det er jo å hjelpe dem til å få øye på egne tanker, og lære seg å reflektere og være kritisk til det de selv tenker og uttrykke seg og så videre. Målet er jo ikke en tekst. Vi har ikke skolen for å produsere flest mulig stiler. ChatGPT er bare et symptom. Det er ikke problemet. Problemet er at vi ikke er helt tydelige på hva som er målet, som er å lage vellykkede og lykkelige mennesker.

Sammenlikningen med kalkulatoren fungerer godt. Når kalkulatoren kom var det et hjelpemiddel som lot elever enkelt regne mattestykker uten å måtte sette opp algoritmer eller «forstå» hva de gjorde. De bare trykket inn noe, ut kom svaret og de tenkte ikke mer over det. Det var ikke sikkert at det var det rette svaret på oppgaven, fordi elevene måtte lære å forstå hva kalkulatoren skulle regne ut før de kunne være sikker på at det var det riktige svaret som kom ut. Kalkulatoren var den gangen et sjokk for realfaglærerne. Nå lever de fint med både kalkulatoren, regnearket, GeoGebra og CAS med mer. Digital teknologi er blitt en del av faget, hvordan vi må forstår det og hvordan vi lærer det.

Det som er nytt med ChatGPT er at dette er første gang humaniora har fått et digitalt verktøy som utfordrer måten de jobber med kunnskap på, eller mer nøyaktig – språk. På denne måten er det en fin sammenlikning med kalkulatoren. Kalkulatoren tok vekk en del av prosessene i matematikken, men ikke kunnskapen om hva matematikk er og hvordan den brukes. Det gjør ChatGPT også. Det er et helt annet verktøy som er mer omfattende og komplisert, men det har mye av den samme effekten på undervisning i humaniora som kalkulatoren i realfagene.

Språk er vanligvis forstått som tenkningens verktøy. Den underliggende antakelsen er at tankeprosessene våre bearbeider våre erfaringer med verden gjennom en samling sammenhengende ord. Det er denne koblingen mellom språk og tenkning som nå rokkes ved, og som lager så mye støy i skolen og offentligheten. Utfordringen er at språk ikke er en god indikator for tenkning. Tenkning foregår på svært mange andre måter enn bare gjennom språk.

De av oss som forstår at ChatGPT generelt sett kan bestå et fag har også identifisert grunnen til at den kan det. Vi måler måloppnåelse gjennom ytre tegn for for det vi egentlig vil måle. Å gjengi isolerte fakta er et ytre tegn for kunnskap. En god uttrykksevne er et ytre tegn for sofistikert forståelse. En godt organisert tematisk tekst er et ytre tegn for dybdeforståelse. Utfordringen er at disse ytre tegnene for indre kompetanse virker ikke lengre. Det var kanskje gode grunner til å gjøre dette tidligere, men alle disse tre erstatningene virker ikke lengre, eller rettere sagt, de ordnes enkelt av en lett tilgjengelig gratis algoritme. De ytre tegnene har mistet verdien sin.

Konfabulering

Grunnen til at ChatGPT ikke er god på informasjon og faktaopplysninger, er rett og slett fordi den er en kunstig intelligens for språk og ikke for å finne frem korrekte opplysninger. Den vet ikke noe om det den skriver, annet enn at det er den mest korrekte rekken av stavelser ut fra det du ga den i ledeteksten. Derfor vet den ikke om det du leser stemmer med virkeligheten eller ikke. Wikipedia ligger ikke lagret noe sted, selv om den har trent på alt som står der. Er GPT trent nok på et tema vil den produsere noe som stemmer med virkeligheten, men den produserer like selvsikkert noe som ikke stemmer med virkeligheten om ting den ikke har trent nok på.

Hvis du gir den ledeteksten «Hva heter hovedstaden i Frankrike?» så vet ikke GPT at Paris er hovedstaden i Frankrike. Det den vet er at ordet «Paris» er den naturlige teksten å skrive, fordi det har den sett mange ganger mens den trente. Hvis du skriver et spørsmål GPT den ikke er trent godt på men hvor den gjenkjenner teksten som helsesjargong vil den svare i helsesjargong. Da risikerer du at svaret fra GPT høres riktig ut, selv om det faktisk kan være helt feil. Det finnes mange gode eksempler på dette. Du må gjerne prøve å få GPT til å gjengi tekster til kjente norske barnesanger eller liste opp romaner av André Bjerke.

Mange sier at GPT hallusinerer når den skråsikkert skriver ting som ikke stemmer med virkeligheten, men den gjør ikke det. Det er bedre å si at den konfabulerer sammen med deg og ledeteksten du gir den. GPT gjør det den vet er rett ut fra at den er en språkmodell og kan ikke vite om det den skriver stemmer med virkeligheten eller ikke.

Vi må bruke ChatGPT til det den er god på, som er språk – ikke fakta. Det er like galt å klage på at ChatGPT ikke kan regne, som det er å klage på at en kalkulator ikke kan skrive.

Uansett må vi gå vekk fra å tenke i dystopiske eller utopiske termer. ChatGPT gir både nye muligheter og ny kompleksitet. Så langt har det stort sett blitt fremstilt som et verktøy for produksjon av innhold. Faktisk er generering av innhold sannsynligvis den svakeste funksjonen den har. Der den utmerker seg er når den manipulerer struktur og form, og i den forbindelse også gjør vurderinger om hva en eksisterende tekst inneholder. GPT får virkelig vise hva den kan når den endrer struktur og form på en tekst, samtidig som den opprettholder og stabiliserer meningen i teksten. Lærere må være oppmerksomme på dette, og også informere elevene om begrensningene ChatGPT har som en kilde til kunnskap – og hvorfor.

Hva er ChatGPT (og andre LLMer) gode til?

En personlig ressurs for elever (og lærere)

ChatGPT gir elever (og lærere) enkel tilgang til fagstoff og skriving/språk som en ferdighet. Dette til tross for at det nettopp ble skrevet at ChatGPT ikke er til å stole på i forhold til korrekte beskrivelser av verden. Poenget er at elever gjennom ChatGPT når som helst får tilgang til kompetanse de selv (eller hjemmet) ikke besitter. De kan hente fram godt formulert tekst og god nok allmennkunnskap, som de ellers ikke ville hatt tilgang til. De får også hjelp til å formulere seg godt når de trenger det.

Vi som jobber i skolen må aldri glemme hva ressurssterke foreldre gir barna sine i skolen. Når det oppstår en situasjon hjemme hvor barnet har behov for det, kan de gi riktig tilpassede fragmenter av kunnskap og språk til barna sine, og som barnet vil bli preget av. Denne typen mikroundervisning har mange barn ikke tilgang til, og her kan ChatGPT spille en positiv rolle.

Det er i debattene etter 30. november 2023 ofte sagt at elever «tenker» med skriftspråket, og det er nesten riktig. Vi tenker med språk (og mange andre kognisjoner), men vi må ikke skrive det ned for å kunne gjøre det. Dette er en svært akademisk måte å tilnærme seg virkeligheten på, og det er ofte akademikere som sier dette i leserinnlegg. På samme måte som noen trenger en kalkulator for å regne ut enkle regnestykker, trenger andre også hjelp til å formulere gode tekster.

Ikke mulig å unngå

LLMer allerede er en del av hverdagen og de kommer ikke til å forsvinne. Det dukker opp flere nye AI-tjenester hver eneste uke. Om en kommune sperrer tilgangen hjelper det i beste fall bare på skolen. Den eneste måten å sperre tilgangen til AI på skolen er å sperre tilgangen til Internett og om ikke så lenge vil det heller ikke være nok. Da må all tilgang til digitale enheter forbys eller strengt kontrolleres. Å late som om LLMer ikke eksisterer i skolen gir bare en fordel til de som trenger det minst. Ressurssterke elever vil skaffe seg tilgang uansett, mens elever som ikke henger med i skolehverdagen vil ikke være i stand til å bruke mer enn det de har på Chromebooken eller iPaden. De ressurssterke elevene har, som nevnt over, også ofte ressurssterke foreldre.

Derfor er det vår jobb i skolen å sørge for at lærere og elever både får tilgang til, og blir kjent med, hva AI og LLM er og ikke er, hva de gjør bra og hva de ikke gjør bra, hvordan de kan bruke det til å berike undervisningen og læringen, og hvordan de skal forholde seg til det i samfunnet.

ChatGPT er bare begynnelsen. Det dukker opp flere nye tjenester hver eneste uke og der de fleste benytter seg av GPT i bunnen. ChatGPT er for underveisvurdering det COVID var for digitalisering av skolen. Et direkte møte med en ny virkelighet vi ikke kan unngå.

Og så dette med å omforme tekst

Siden ChatGPT er god til å arbeide med eksisterende tekst og ikke alltid så god på produsere faktainnhold, er det dette som bør være fokuset for god bruk i skolen.

Bruk ChatGPT som samtalepartner til et tema eller noe du lurer på, men der du må gi den opplysninger om hva den skal være med å snakke om.

ChatGPT er god til å forstå innholdet i en tekst. La den hjelpe deg med å forstå innhold i teksten. Derfor er den også flink til å forenkle og forkorte tekster, og den bytter enkelt sjanger på en tekst – mange ganger. I tillegg oversetter den godt, og i alle fall om du også ber den om en idiomatisk oversettelse.

Og siden ChatGPT kan oversette er den også rå til å kode! Rettere sagt, den er god til å oversette fra språk til koding (som er en type språk), og omvendt. ChatGPT kan forklare hva et program gjør ved å se på koden til det.

Konfabuleringen kan du bruke som en positiv og konstant utfordring til kildekritikk for elevene, og noen ganger er det riktig morsomt å lese hva den produserer.

Mange elever har gode ideer og mye de vil si, men de vet ikke alltid hvordan de skal uttrykke det på riktig måte. ChatGPT kan hjelpe elever med å presentere ideer på en klar og organisert måte og i riktig form, slik at læreren kan fokusere på ideene i seg selv. I prosessen kan vi endre fokuset i utdanning mot mer kritisk tenkning og store spørsmål. Siden ChatGPT også kan oppsummere et argument, kunnskap og konsepter, har den et reelt potensial til å hjelpe med formativ vurdering, spesielt i situasjoner der lærere har begrenset tid.

Tenk nytt! De ytre tegnene for indre kompetanse gjennom skriftspråk har ikke samme verdi lengre.

Så hva gjør vi nå?

Skoler kan ikke vente på at myndighetene skal fortelle dem hvordan de skal håndtere disse nye digitale verktøyene. Lærere må sammen diskutere hvordan ChatGPT (og liknende tjenester) best kan brukes i skolen, og skoleledere må skape tid og rom til disse samtalene. Det er også viktig å erkjenne at elever har en mer nyansert forståelse av teknologien enn vi av og til gir dem kreditt for. De har allerede begynt å tulle med disse tjenestene og bruker dem til det de synes de er nyttige til. Noen fusker, noen tuller, noen herjer og noen prøver å bruke det så godt de kan, og flere har oppdaget at snarveiene til ferdige besvarelser ikke alltid gir den tilfredsstillelsen de håpet på. Elevene merker selv at det er mer med skolen enn det ChatGPT kan gjøre for dem, og den følelsen må vi forvalte vel. Det er viktig at elever er en del av denne samtalen.

Men først må ChatGPT og andre LLMer bli tilgjengelige for lærere og elever på en ordnet og lovlig måte. Det er dette vi i Randabergskolen nå forsøker å ordne gjennom nettstedet AI i Randabergskolen. Der får lærere og elever tilgang til ChatGPT v3.5, og tjenesten er satt opp med OpenAIs API-løsning, hvor ingenting blir lagret eller brukt av OpenAI. Ingen trenger å logge på ChatGPT, fordi alt går gjennom Randabergskolens API-konto. Det betyr at all trafikk til OpenAI kommer fra én IP-adresse / én bruker og det er denne brukeren som må betale for bruken – med penger. Så lenge vi bruker GPT v3.5 koster det rundt kr 10 for 300 000 ord, og det er ikke så dyrt.

Og så gjør vi som alle som vil lære noe nytt… Vi leker med det!

PS! Kanskje åpner vi opp for ChatGPT v4 også. Det er markert bedre enn v3.5, men også over 10 ganger dyrere.