Statusartikel

Kunstig intelligens i forskning

Zubair M. Mojadeddi & Jacob Rosenberg

15. apr. 2024

11 min.

Hovedbudskaber

Forskere har længe brugt ekstern hjælp i forskningsprocessen. I denne artikel refererer termen »forsker« til enhver professionel, som aktivt deltager i forskningsprocessen, og blandt disse er ud over læger, medicinstuderende, sygeplejersker m.fl. også statistikere, forskningssygeplejersker, laboranter og medical writers [1]. Desuden anvendes statistiske pakker til dataanalyse og værktøjer som Grammarly og Word til at rette grammatiske fejl og stavefejl. Brugen af disse værktøjer har i høj grad lettet forskningen og gjort forskeres arbejde mere effektivt. Fremkomsten af sådanne professionelle værktøjer og software har optimeret forskningsprocessen, og det næste ser ud til at være kunstig intelligens (AI) [2-5]. AI refererer til maskiners evne til at simulere menneskelige processer [6, 7]. AI dækker over en række teknologier. Nogle af disse teknologier inkluderer maskinlæring, dyb læring, neurale netværk m.fl. (Figur 1).

Med AI er der dukket forskellige afledte værktøjer op. Disse omfatter store sprogmodeller (chatbots) såsom ChatGPT [8] og Bard [9], billedgeneratorer som DALL‧E [8] og Midjourney [10], automatiserede talegenkendelsessystemer såsom Whisper [8] og Dragon [11] og videogeneratorer såsom Synthesia [12] (se Tabel 1).

CHATGPT-TEKNOLOGI

ChatGPT er baseret på GPT-arkitektur, som er et neuralt netværk. ChatGPT benytter den såkaldte transformerteknologi [13-15].

Før ChatGPT kan give et relevant svar, skal den først forstå, hvad brugeren spørger om: Først omdannes hvert ord i prompten til et numerisk format (token) – en proces, der kaldes word embedding. Dernæst, for at teknologien kan forstå, hvor hvert ord er placeret i sætningen, anvendes en teknik kaldet position encoding, der tildeler en værdi til hvert ord baseret på dets placering. Ydermere gør den brug af en masked self-attention-mekanisme, som ser på, hvordan hvert ord i prompten relaterer sig til sig selv og det foregående ord. Dette gøres for at forstå, hvordan ordene er relateret til hinanden. Efter at chatten har gennemgået hele teksten, får hvert ord en ny værdi baseret på denne analyse. Værdierne fra position encoding og masked self-attention lægges sammen. Disse kombinerede værdier hjælper teknologien med at forudsige det næste ord i sekvensen gennem matematiske beregninger [13-15].

Efter at ChatGPT har forstået, hvad brugeren spørger om, genererer den et svar. Svaret er baseret på de data, den har adgang til. Svaret genereres ved brug af de samme tre teknologier (word embedding, position encoding og masked self-attention). Når teknologien er færdig med at generere et svar, markerer den slutningen ved at generere et såkaldt end of sentence (EOS)-token [13-15].

En anden teknologi, som er brugt i ChatGPT til at træne den, er reinforcement learning from human feedback. Dette giver chatten mulighed for at generere bedre svar gennem menneskelig feedback. Med andre ord så forudser den det mest sandsynlige ord baseret på dine prompts og de data, den er trænet på [15].

BRUGEN AF KUNSTIG INTELLIGENS I FORSKNINGSPROCESSEN

Forskningsprocessen kan generelt opdeles i fem faser: hypotese- og studieplanlægning, dataindsamling, dataanalyse, skriveprocessen og indsendelse af artikel til tidsskrift.

I studieplanlægning kan AI tilbyde forskellige fordele for forskere. Chatbots kan give værdifuld støtte ved at hjælpe med at generere idéer til forskningsprojekter, identificere relevante fonde og tilbyde hjælp til at skrive fondsansøgningerne.

I dataanalysen kan AI-værktøjer tilbyde værdifuld assistance, specielt hvis det handler om sproglige analyser. Chatbots kan således definere kategorier, temaer og underkategorier for transskriberede interview i kvalitative forskningsprojekter. Selvom chatbots har evnerne til at udføre dataanalyse, er deres kvalitet dog endnu ikke sammenlignelig med gængse metoder.

Ud over chatbots kan talegenkendelsessystemer også være nyttige for forskere. OpenAI-programmet Whisper er et eksempel på et talegenkendelsessystem. Det kan meget hurtigt transskribere lydfiler på ca. 100 sprog og forskellige accenter. Dette AI-værktøj kan således markant reducere tiden brugt på manuel transskribering. Dog er anvendelsen af Whisper for den gængse forsker kompleks, hvis man ikke er bekendt med kodning, og af denne årsag er der udkommet en del letanvendelige offlineversioner af dette program. Disse offlineversioner benytter Whispers AI-teknologi igennem et application programming interface, som er en slags bagdør til data, og de findes f.eks. som appen Aiko [16] samt programmet Whisper Transcription [17], der begge er tilgængelige til Macs. Disse apps udmærker sig ved at være meget nemme at bruge, og ved at de kører 100% offline. Man downloader en stor sprogfil, og transskriberingen foregår derfor offline og uden krav til viden om programmering.

Chatbots kan hjælpe forskere med at udarbejde de forskellige sektioner af en videnskabelig artikel, f.eks. introduktionsafsnittet [18]. Derudover kan de levere relevant litteratur, selvom det er afgørende at verificere referencerne, da nogle chatbots i øjeblikket kan »hallucinere«, dvs. generere falske svar. Desuden kan de hjælpe forskeren med grammatik, stavning, syntaks og skrivestil, hvilket gør det muligt for forskere at producere artikler eller andet skriftligt materiale på selvvalgte forskellige akademiske niveauer. Andre AI-værktøjer såsom DALL∙E [8] og Midjourney [10] kan hjælpe forskere med at producere illustrationer til en artikel (Figur 2).

Endelig kan AI-værktøjer også hjælpe i den sidste fase, som er indsendelse af artiklen til et tidsskrift. Chatbots kan hjælpe med at skrive følgebreve [19], forespørgsler og formatere manuskriptet, så det overholder specifikke krav fra tidsskriftet, herunder korrekt formatering af referencer [20].

Ud over de nævnte eksempler kan chatbots og AI-værktøjer yde assistance på mange områder, f.eks. ved at kunne oversætte mellem forskellige sprog, skrive opslag til sociale medier, debatindlæg til aviser og meget andet. Det forudsætter dog, at brugeren er villig til at investere tid i at forstå, hvordan disse teknologier fungerer, herunder at lære at »prompte« effektivt for at opnå de mest præcise og nyttige output. Selvom det kan virke udfordrende ved første øjekast, er processen med at prompte ikke så kompleks, som man måske antager. Faktisk er den mest effektive måde at mestre denne færdighed på at eksperimentere med forskellige prompts. Det synes at være en fordel at give en lang og detaljeret forklaring i sin prompt frem for at udelukke noget blot for at gøre det kort.

FORFATTERSKAB

Spørgsmålet om, hvorvidt AI-værktøjer skal akkrediteres som medforfatter på artikler, har fanget tidsskrifters og forlags opmærksomhed, især med lanceringen af ChatGPT i slutningen af 2022 [21]. I øjeblikket er der voksende enighed blandt forlag om, at AI ikke opfylder de forfatterskabskriterier, der er fastlagt af International Committee of Medical Journal Editors (ICMJE), som også selv angiver, at AI-værktøjer ikke kan medtages som medforfattere, men at der skal være transparens ved brugen af AI-værktøjer [22]. Således har f.eks. Nature [23] og Science [24] specifikt udtalt, at ChatGPT ikke kan accepteres som forfatter, men bør nævnes under taksigelser eller i metodeafsnittet, hvis det har været anvendt i skriveprocessen.

DISKUSSION

Ved første øjekast virker AI-værktøjer meget imponerende og har mange styrker, men der er også en række potentielle problemer. AI-værktøjer skal ikke ses som en erstatning for forskere, men som en hjælp. Derfor skal man, hver gang et AI-værktøj er blevet brugt, omhyggeligt kontrollere de givne svar. Det skyldes, at AI er baseret på eksisterende data, og svarene er bundet til disse datasæt. Selvom AI kan udvikle sig med input af nye data, er teknologien ikke fejlfri [25]. Ud over dette oplyser skaberne af chatbotten ChatGPT, at botten har begrænsninger. Nogle af disse er, at den kan generere forkerte svar, skadelige instruktioner eller være forudindtaget [8]. ChatGPT’s hallucinationsproblem kan i nogen grad formindskes ved at bruge den betalte version, GPT-4, og dennes pluginmuligheder med adgang til internettet. Selvom hallucinationsproblematikken kan formindskes, vil enhver, der gør brug af AI, stå til ansvar for outputtet. Dermed anbefales det at være ekstra opmærksom på hallucinationer.

En anden begrænsning, der opstår ved brugen af chatbots, er spørgsmålet om opbevaring af følsomme data, som potentielt kan være i strid med General Data Protection Regulation (GDPR) [26]. Hvis en forsker bruger en chatbot til analyse af interview med følsomme data, rejser det spørgsmålet om, hvor de data vil blive opbevaret. Ifølge ChatGPT gemmer den ikke data, dvs. lydfilen og den transskriberede tekst, men systemet kan gemme data midlertidigt i en cache. Denne lagring af data på servere hos OpenAI kan være i strid med GDPR-reglerne. Derfor bør forskere, før de bruger chatbots til at analysere følsomme data, fjerne enhver identificerbar eller følsom information fra interviewene for at undgå potentielle overtrædelser af GDPR-reglerne. En løsning på GDPR-problematikken ved transskribering af interview kan være brug af offlineversioner som f.eks. Aiko og Whisper Transcription, hvis man blot opfylder andre regler for datahåndtering som f.eks. transport på krypterede medier og regler for sletning og opbevaring af data.

ChatGPT er trænet på det frie internet, som kan tilgås fra Common Crawl og har ca. 10¹² ord [27, 28]. Vi ved ikke, hvor mange data der ligger bag GPT-4, da dette ikke er offentliggjort. Selvom det kan være fordelagtigt at have en stor mængde data, er det vigtigt at bemærke, at AI ikke har ubegrænsede data, så begrænsningen af data er et potentielt biasproblem. En anden begrænsning er, at data kan være partiske. Hvis data er partiske, vil chatbotten sandsynligvis også være forudindtaget. Desuden forstår brugeren ikke fuldt ud, hvordan AI genererer sine svar pga. det komplekse samspil mellem de forskellige lag i systemet [25]. Dette kan også ses som en begrænsning, fordi vi ikke ved, om botten genererer nye og originale svar, hver gang et spørgsmål stilles, eller om den blot gengiver tidligere lært information. Selvom ChatGPT har mulighed for at tilegne sig ny viden gennem samtale, er det stadig uklart for brugeren, hvordan den behandler og integrerer denne nye information.

AI-modeller, inklusive ChatGPT, er kun trænet på data indtil et bestemt tidspunkt. ChatGPT har således kun data indtil april 2023 [8]. Det betyder, at chatbotten kræver regelmæssige opdateringer for at holde sig opdateret med nye oplysninger. Dog er nogle chatbots opdateret pga. adgang til internettet, f.eks. GPT-4 via plugins og Perplexity AI [29], som trækker på opdateret information fra internettet.

I de seneste måneder er flere andre chatbots dukket op, herunder Googles Bard [9] og Metas Llama [30]. Derudover er der rygter om, at en mere avanceret version af ChatGPT, den såkaldte GPT-5, er under udvikling. Udviklingen går således meget stærkt, og stigningen i tilgængeligheden af AI-værktøjer til offentligheden og forskere markerer derfor den næste digitale tidsalder.

KONKLUSION

Selvom AI-værktøjer har begrænsninger, kan de give værdifuld hjælp til forskere. AI-modellerne kan hjælpe forskeren i forskellige faser af forskningsprocessen. Man kan dog opleve fejl fra AI, og derfor bør AI-værktøjer omfavnes med forsigtighed og bruges som et værktøj til at forbedre forskningsprocessen. AI er i meget hurtig udvikling, og vi har kun set begyndelsen. De kommende år vil byde på forskellige typer af AI-teknologier, som kan optimere forskningsprocessen yderligere, og derfor bør forskere, udgivere og tidsskrifter ikke udelukke brugen af disse teknologier.

Korrespondance Zubair M. Mojadeddi. E-mail: zubair.m.mojadeddi@hotmail.com

Antaget 8. februar 2024

Publiceret på ugeskriftet.dk 15. april 2024

Interessekonflikter ingen. Forfatternes ICMJE-formularer er tilgængelige sammen med artiklen på ugeskriftet.dk

Referencer findes i artiklen publiceret på ugeskriftet.dk

Artikelreference Ugeskr Læger 2024;186:V08230532

doi 10.61409/V08230532

Open Access under Creative Commons License CC BY-NC-ND 4.0

Summary

AI in medical research

This review delves into the possible role of artificial intelligence (AI) in medical research, from planning to publication. AI can aid in idea generation, data analysis, and writing, with tools like chatbots and transcription systems enhancing efficiency. However, AI’s limitations, including the “hallucination” problem in which it generates false information, require careful use and verification. Ensuring anonymity compliance with sensitive data is also vital. AI’s transformative potential in research brings opportunities for innovation, necessitating mindful application to manage biases and data accuracy.

Referencer

Rosenberg J. Det er i orden at anvende en medical writer i medicinsk forskning. Ugeskr Læger. 2013;175(34):1865.
Kaul V, Enslin S, Gross SA. History of artificial intelligence in medicine. Gastrointest Endosc. 2020;92(4):807-812. doi: https://doi.org/10.1016/j.gie.2020.06.040
Amisha, Malik P, Pathania M, Rathaur VK. Overview of artificial intelligence in medicine. J Family Med Prim Care. 2019;8(7):2328-2331. doi: https://doi.org/10.4103/jfmpc.jfmpc_440_19
Ramesh AN, Kambhampati C, Monson JRT, Drew PJ. Artificial intelligence in medicine. Ann R Coll Surg Engl. 2004;86(5):334-8. doi: https://doi.org/10.1308/147870804290
Holmes JH, Sacchi L, Bellazzi R et al. Artificial intelligence in medicine AIME 2015. Artif Intell Med. 2017;81:1-2. doi: https://doi.org/10.1016/j.artmed.2017.06.011
Esteva A, Robicquet A, Ramsundar B et al. A guide to deep learning in healthcare. Nat Med. 2019;25(1):24-29. doi: https://doi.org/10.1038/s41591-018-0316-z
TechTarget. Artificial intelligence (AI), 2023. https://www.techtarget.com/searchenterpriseai/definition/AI-Artificial-Intelligence. (15. dec 2023).
OpenAI. OpenAI. https://openai.com/ (15. dec 2023)
Pichar S. An important next step on our AI journey, 2023. https://blog.google/technology/ai/bard-google-ai-search-updates/ (15. dec 2023).
Midjourney. https://www.midjourney.com/home/ (15. dec 2023).
Poulter C. Voice recognition software - nuance dragon naturally speaking. Occup Med. 2020;70(1):75-76. doi: https://doi.org/10.1093/occmed/kqz128
Synthesia. https://www.synthesia.io/ (15. dec 2023).
Vaswani A, Shazeer N, Parmar N et al. Attention is all you need, 2023. https://arxiv.org/abs/1706.03762 (15. dec 2023).
Radford A, Narasimhan K, Salimans, Sutskever I. Improving language understanding by generative pre-training. arXiv preprint 2018. https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf (15. dec 2023).
ThoughtSpot. Data trends: Artificial Intelligence, 2023. https://www.thoughtspot.com/data-trends/topics/ai (25. mar 2024).
Sindre Sorhus. Aiko AI speech-to-text (transcribe). Apple Store, 2023. https://apps.apple.com/us/app/aiko/id1672085276 (15. dec 2023).
Good Snooze. Whisper Transcription Voice, Speech, Audio Dictation. Apple Store, 2023. https://apps.apple.com/us/app/whisper-transcription/id1668083311?mt=12 (15. dec 2023).
Sikander B, Baker JJ, Deveci CD et al. ChatGPT-4 and human researchers are equal in writing scientific introduction sections: a blinded, randomized, non-inferiority-controlled study. Cureus. 2023;15(11):e49019. doi: https://doi.org/10.7759/cureus.49019
Deveci CD, Baker JJ, Sikander B, Rosenberg J. A comparison of cover letters written by ChatGPT-4 or humans. Dan Med J. 2023;70(12):A06230412.
Shabsh Ltd. Thrix, 2024. www.thrix.ai (24. mar 2024).
Mojadeddi ZM, Rosenberg J. The impact of AI and ChatGPT on research reporting. N Z Med J. 2023;136(1575):60-64.
International Committee of Medical Journal Editors. Defining the role of authors and contributors, 2024. https://www.icmje.org/recommendations/browse/roles-and-responsibilities/defining-the-role-of-authors-and-contributors.html (23. mar 2024).
Stokel-Walker C. ChatGPT listed as author on research papers: many scientists disapprove. Nature. 2023;613(7945):620-621. doi: https://doi.org/10.1038/d41586-023-00107-z
Thorp HH. ChatGPT is fun, but not an author. Science. 2023;379(6630):313. doi: https://doi.org/10.1126/science.adg7879
Zohuri B, Moghaddam M. Deep learning limitations and flaws. Mod App Matrl Sci. 2020;2(3):241-250. doi: https://doi.org/10.32474/MAMS.2020.02.000138
General data protection regulation, intersoft consulting. GDPR personal data, 2016. https://gdpr-info.eu/issues/personal-data/ (15. dec 2023).
Liu Z, Roberts RA, Lal-Nag M et al. AI-based language models powering drug discovery and development. Drug Discov Today. 2021;26(11):2593-2607. doi: https://doi.org/10.1016/j.drudis.2021.06.009
Common Crawl. https://commoncrawl.org/ (15. dec 2023).
Perplexity.ai, 2022. https://www.perplexity.ai/ (23. mar 2024).
Meta. Introducing LLaMA: a foundational, 65-billion-parameter large language model, 2023. https://ai.meta.com/blog/large-language-model-llama-meta-ai/ (15. dec 2023).