Skip to main content

Kunstig intelligens og lægestudiet

Påstand: AI vil ikke erstatte folk, men folk, der bruger AI, vil erstatte dem, der ikke bruger AI. Om fordele og ulemper ved at bruge AI i uddannelse.

Foto: Colourbox
Foto: Colourbox

Jeppe Emmersen1, Mike S. Astorp2, 3, Stig Andersen3, 4

1) Det sundhedsvidenskabelige fakultet, Aalborg Universitet, 2) Akut- og Traumecenter, Aalborg Universitetshospital, 3 Klinisk institut, Aalborg Universitet, 4) Geriatrisk afdeling, Aalborg Universitetshospital

3. mar. 2023
6 min.
»Studerende vil fremover have adgang til avanceret teknologi, der foreløbig opererer på vidensniveau. Vi er nødt til at have kendskab til dette, da det har konsekvens for fremtidens lægegerning«Jeppe Emmersen, Mike S. Astorp og Stig Andersen

Artificial intelligence (AI) rykkede i 2022 meget tæt på hverdagen i dansk uddannelsessammenhæng.

I uddannelsessammenhæng vurderer vi, at adgang til og brug af AI vil få store konsekvenser, da viden nu er tilgængelig sammen med evnen til at vurdere, sammenligne, parafrasere etc. Særligt for medicinuddannelsens basale fag og de tilhørende eksamener skal vi tage stilling til, hvordan AI håndteres. Men med mere data og mere avancerede modeller vil skriftlige eksamener og opgaver blive udfordret, da output fra en AI-model ikke på samme måde kan plagiatkontrolleres, i forhold til hvis man kopierer kendte tekster ind i en opgave. Hvert svar fra en AI kan gøres unikt.

ChatGPT er en sprogmodel baseret på neurale netværk (GPT = generative pre-trained transformer), en særlig statistisk model med 175 × 10parametre, der samlet fylder ca. 800 gigabyte [1]. Modellen er således noget mere avanceret end en normal lineær regression og er vel for nu »state of the art« i kunstig intelligens. Data til modellen er i princippet tekst fra det samlede åbne og frie internet, som kan tilgås fra common-crawl (https://commoncrawl.org/). I alt cirka 1012 ord, der kan siges at repræsentere dele af vores samlede viden nedfældet på skrift. Andelen af dansk tekst er omtrent 0,4% og engelsk tekst 46% [2].

Det særlige ved denne model er, at den har en begrænset hukommelse, så den husker en given kontekst i de tekstprompt, der bruges som input. Eksempelvis hvis emnet er medicinsk uddannelse, så indgår det i konteksten af næste input. Samtidig kan modellen også modellere metalag som teksttype, vurderinger, analyse af tekst eller oversætte mellem sprog. Sprog kan i den sammenhæng være naturlige sprog, men også f.eks. computersprog.

Det er dog også vigtigt at være opmærksom på, at i mange sammenhænge er svarene fejlbehæftede, selvom svaret sprogligt set er korrekt. F.eks. har man testet ChatGPT med simple regneopgaver, der i den nuværende model regner 100% rigtigt ved addition af to tal, 94,2% rigtigt ved subtraktion af tre tal, men kun 9-10% korrekt ved femtalsoperationer [1].

Som eksempel på input/output fra ChatGPT kan vi stille den følgende to spørgsmål i sammenhæng, og under hvert af disse følger et svar:

Hvilke innovative løsninger kan anvendes i medicinsk uddannelse?

Der er flere innovative løsninger, der kan overvejes for at sikre den bedst mulige medicinske uddannelse. Virtual Reality (VR) og Augmented Reality (AR) teknologi: Det kan bruges til at give eleverne mulighed for at simulere komplekse medicinske scenarier og øve på færdigheder, uden at det koster så meget som at gøre det i virkeligheden. E-learning: Det kan være en måde at levere undervisning og vejledning på, som kan spare på omkostningerne ved at reducere antallet af fysiske klasselokaler og lærerlønninger. Telemedicin: Det kan bruges til at levere medicinsk rådgivning og behandling på afstand, hvilket kan spare på omkostningerne ved transport og hospital ophold. Simulationstræning: Det kan bruges til at øve på komplekse medicinske scenarier i en kontrolleret miljø, hvilket kan reducere omkostningerne ved at bruge patienter i træningen. Case-baserede læring: Det kan være en effektiv måde at undervise på, da det kan hjælpe eleverne med at anvende teori i praksis og forstå patientperspektivet.

En anden vinkel til at se potentialet er at bede om hjælp til at formulere konkrete spørgsmål til en eksamen i f.eks. nyresygdomme. Her prøver vi at bede om to forskellige sværhedsgrader i udformningen af spørgsmålet, så der er grundlag for bedømmelse, igen gengives disse som spørgsmål-svar.

Provide three easy questions and difficult questions of kidney toxicity!

Easy questions: What are the symptoms of mild kidney toxicity? Which class of medications is associated with a lower risk of kidney toxicity? How can the risk of kidney toxicity be minimized in patients receiving these medications?Difficult questions: Describe the mechanism of kidney toxicity caused by a certain medication? What laboratory tests can be used to monitor kidney function in patients receiving a certain medication? How can the risk of kidney toxicity be evaluated in patients with pre-existing kidney disease?

Og her følger et svar på første spørgsmål uredigeret som svaret af ChatGPT:

What are the symptoms of mild kidney toxicity

The symptoms of mild kidney toxicity can vary depending on the cause and the specific medication involved, but some common symptoms may include: Changes in urine output: The patient may have decreased urine output or may have dark-colored urine. Swelling: The patient may have swelling in the legs, ankles, or feet caused by fluid buildup. Fatigue: The patient may feel tired or weak. Nausea or vomiting: The patient may experience stomach upset or may feel sick to their stomach. Headaches: The patient may have headaches. Dizziness: The patient may feel lightheaded or dizzy. Back or side pain: The patient may have pain in the lower back or side. It is important to note that these symptoms may be caused by other conditions as well, and a proper diagnosis should be made by a healthcare professional. Additionally, it’s important to keep in mind that these symptoms are typically mild and reversible when the medication is discontinued or the dose is adjusted.

Det interessante er, at ChatGPT genererer spørgsmål og svar på niveau med det, der forventes af medicinstuderendes vidensniveau efter et kursus i nyresygdomme på de senere semestre af bacheloruddannelsen.

Konklusion

Studerende vil fremover have adgang til avanceret teknologi, der foreløbig opererer på vidensniveau. Vi er nødt til at have kendskab til dette, da det har konsekvens for fremtidens lægegerning og dermed for den funktion og sammenhæng, fremtidens læger arbejder i, og de dermed skal uddannes til. Endvidere har det konsekvens for uddannelse og eksamen, der skal fremme og sikre lægestuderendes forståelse for og kritiske brug af AI.

Dette er ikke kun et redskab for studerende, men vil også blive et værdifuldt redskab for undervisere og eksaminatorer, eksempelvis til formativ, adaptiv udprøvning og evaluering.

Et vigtigt spørgsmål er, om dette er det sidste søm i kisten til den rene vidensbaserede eksamen. I det mindste er vi nødt til at gentænke medicinsk eksamen, og hvis vi ikke gør det, bliver uddannelsen af læger overhalet af AI, og et generelt forbud mod brugen af AI-værktøjer er fortid. Sidst skal man også overveje klimapåvirkningen af AI, men her arbejdes på at nedsætte brug af beregninger, når AI genererer svar [3].

Vi opfordrer alle med interesse for uddannelse til at undersøge, afprøve og finde veje til smart anvendelse af disse værktøjer i egen praksis og være kritiske i brugen heraf.

Referencer

Brown T, Mann B, Ryder N et al. Language models are few-shot learners. Advances in Neural Information Processing Systems 33 (NeurIPS 2020).

Statistics of Common Crawl Monthly Archives. Distribution of Languages, 2023. https://commoncrawl.github.io/cc-crawl-statistics/plots/languages (22. jan 2023).

Wilkins A. Huge AI models can be halved in size without degrading performance, 2023. NewScientist.