Kunstig intelligens og føtalmedicinsk ultralydskanning

Caroline Taksøe-Vester1, 2, 3, Zahra Bashir1, 3, 4, Emilie Pi Fogtmann Sejer1, 2, 3, Mary Le Ngo1, 3, 4, Lars Henning Pedersen5, 6, Mikkel Friis7, Olav B. Petersen1, 2, Aasa Feragen8, Mads Nielsen9, Anders Nymark Christensen8 & Martin G. Tolsgaard1, 2, 3
Ultralyd (UL)-skanning er en grundsten i føtalmedicin og danner basis for diagnostik og monitorering af fostre. Derfor er uddannelsen inden for dette subspecialiserede område også fokuseret på at udvikle UL-kompetencer. UL-skanning er forbundet med lange læringskurver [1], som bliver yderligere udfordret i føtalmedicin grundet fosterets varierende position samt bevægelser i løbet af undersøgelsen. Den enkelte klinikers ekspertise og erfaring afspejles i detektionsrater af føtale misdannelser [2, 3], hvilket afspejles i højere detektionsrater på højtspecialiserede centre [4]. Andre faktorer såsom overvægt eller præeksisterende medicinske tilstande som f.eks. diabetes kan også give forskelle i detektionsrater [5, 6]. Således vil kvaliteten af diagnostikken i svangreomsorgen potentielt afhænge af, hvem man er, hvor og af hvem man bliver behandlet.
I de senere år er simulationsbaseret UL-oplæring blevet mere udbredt inden for gynækologi, obstetrik og føtalmedicin i forbindelse med oplæring af nye læger, jordemødre og sonografer [7]. Simulationsbaseret UL-oplæring giver et kontrolleret og uforstyrret læringsmiljø, hvor hånd-øje-koordination, systematisk tilgang til undersøgelserne og genkendelse af normal anatomi kan trænes. Det har vist sig, at initial simulationsbaseret træning har reduceret behovet for supervision i den efterfølgende kliniske oplæring [8]. Men læringen fortsætter langt efter simulationskurserne, og her rummer kunstig intelligens (AI) et stort potentiale i føtalmedicin. AI kan støtte klinikeren i den daglige praksis, optimere workflowet ved at automatisere billedlagring og målinger, give feedback på skanningernes komplethed og dermed frigive tid til patientcentreret behandling og samtale. Desuden kan AI potentielt bidrage til at ensrette diagnostikken på tværs af centre ved at objektivisere undersøgelsen til en vis grad og evaluere, hvornår kvaliteten af UL-billeder er gode nok til at kunne udelukke patologi og sikre optimal føtaldiagnostik. På andre områder såsom brystkræftscreening er implementeringen af AI i klinisk praksis allerede nået længere. Her har AI vist sig at kunne reducere radiologernes arbejdsbyrde og samtidig forbedre screeningens kvalitet [9]. Men før man lader sig begejstre og overestimerer den nye teknologis potentiale, bør udfordringer og begrænsninger ved implementering af denne nye teknologi vurderes og undersøges nærmere.
Der er udviklet en lang række avancerede AI-modeller inden for føtalmedicin. Disse modeller kan bl.a. genkende standardplaner og udføre automatiske mål, hvilket er nyttigt til vægtskanning, føtalneurosonografi og føtalekkokardiografi [10, 11] Se Figur 1 for et eksempel på automatiske optegninger. Der er ligeledes udviklet modeller til automatisk at screene for distinkte hjertemisdannelser [12] eller til at identificere mere subtile forskelle i hjerteanatomien ved hjælp af hjerteopmålinger, som f.eks. er relevant ved screening for medfødte hjertemisdannelser såsom coarctation af aorta, som ellers kan give diagnostiske udfordringer [13]. Til gavn i lavindkomstlande med begrænset adgang til UL-ekspertise, er der udviklet AI-modeller til at undersøge placentaplacering med henblik på at vurdere risikoen for placenta prævia [14, 15] samt til automatisk bestemmelse af gestationsalder ved UL-undersøgelser udført af personer uden træning i UL-skanning [16].
Antallet af publikationer om AI i føtalmedicin er steget markant inden for de seneste år. Selv om mange automatiserede modeller har vist imponerende resultater i retrospektive studier, er der kun få studier, der har undersøgt deres gavnlige effekter i klinisk praksis – hvem drager nytte af dem og til hvilket formål? I en prospektiv validering af en model er det ikke overraskende blevet klart, at billedkvaliteten påvirker modellens ydeevne [17]. Dette er vigtigt at tage i betragtning ved implementeringen af disse modeller, da dårlig billedkvalitet er en almindelig udfordring i føtalmedicin på grund af variation i f.eks. fosterposition, BMI og operatørerfaring. Implementeringen af AI-modeller kan kun blive succesfuld, hvis man forstår modellens begrænsninger, og hvis udviklerne har tænkt over, hvordan disse udfordringer kan håndteres.
Inden for føtalmedicin vil klinikeres arbejde ikke kunne overtages af AI-modeller. Den menneskelige kontakt og empati vil ikke kunne erstattes, og derudover er AI-modeller langt fra at kunne levere kritisk tænkning tilpasset den enkelte patient. AI derimod excellerer på områder, hvor mennesker ofte har begrænsninger: Det kan analysere store mængder data hurtigt og præcist, udføre opgaver konsistent og objektivt, behandle information effektivt og automatisere rutinemæssige opgaver [18]. På denne måde komplementerer klinikere og AI hinanden godt og kan sammen skabe en mere effektiv og præcis diagnostik.
For at opnå dette samarbejde i klinisk praksis er der behov for yderligere forskning, der undersøger, hvordan AI-modeller bedst kan integreres i klinikken. Flere studier tyder på, at AI-modeller ikke opnår de bedste resultater på egen hånd, men fungerer bedst i et samarbejde med klinikeren [19-21]. Målet bør være, at AI fungerer som en støtte og aflastning frem for at være en distraktion under arbejdet eller en direkte erstatning. For at nå frem til brugbare integrerede modeller skal vi begynde at udvikle og teste modeller i klinisk praksis og tage højde for den heterogene effekt, AI-modeller kan have på forskellige klinikere [22]. En form for personaliseret AI-assistance, der hjælper novicen med det basale og aflaster eksperten med tidskrævende rutinearbejde, kan være vejen frem. Sidst, men ikke mindst, skal der være fokus på udviklingen i kliniske færdigheder efter oplæring med og brug af AI-værktøjer i dagligdagen, så vi ikke ser ind i en fremtid med mindre kompetente eksperter, der er afhængige af AI-systemer for at kunne udføre deres arbejde.
Det er et naturligt første skridt at udvikle modeller baseret på retrospektive data. Når man har en fungerende model, kan man derefter teste den i klinikken. Forhåbentlig er den store mængde af publikationer om AI-modeller kun begyndelsen på en udvikling, der vil føre til anvendelige og praktiske værktøjer i sundhedsvæsenet.
Til trods for forskeres gode intention om og interesse i at implementere AI-modeller i klinisk praksis er den store implementeringsbarriere de regulatoriske udfordringer på området. De nuværende barrierer skyldes bl.a. strenge regler og krav fra myndigheder om medical device regulation. Da AI-teknologi er relativt ny inden for medicinske og juridiske rammer, er myndighederne også ved at finde deres vej, hvilket resulterer i, at nye reguleringstiltag løbende bliver indført. Det betyder dog også, at der er langt fra udvikling af en model, der virker bedre end eksisterende praksis, til implementering i klinisk drift [23]. Et meget groft estimat på, hvad det koster at få en ny AI-model CE-mærket, dvs. regulatorisk godkendt i Europa, er 10+ mio. kr. De ovennævnte tiltag er selvfølgelig med de bedste intentioner for øje, nemlig at sikre patienterne og beskytte deres personfølsomme data. EU’s »artificial intelligence act« [24] understøtter dette ved at indføre en risikobaseret tilgang til AI, hvor balancen mellem AI-autonomi og krav til menneskelig kontrol afhænger af applikationens risiko.
Med risikostratificering, patientsikkerhed samt fastholdelse af klinikerens autonomi og ansvar in mente bør målet med AI-modeller til læring og diagnostik formentlig ikke være at skabe fuldautomatiserede systemer som selvkørende biler, men snarere at udvikle værktøjer, der understøtter samarbejdet mellem AI og klinikeren. Et eksempel kunne være AI-modeller, der vurderer kompletheden af en skanning og sandsynligheden for, at der er tale om en normal undersøgelse. Samarbejdet kan også bestå i lavpraktisk, at klinikeren gennemgår og godkender anatomiske optegninger, som AI-modellen har foretaget, før de benyttes til den videre diagnostik. Denne form for samarbejde mellem menneske og AI skaber gennemsigtighed i modellens beslutningsproces og sikrer, at klinikeren bevarer kontrollen over både skanningen og den endelige konklusion. Et andet oplagt eksempel er forbedret diagnostik og detektion inden for områder, hvor vores eksisterende modeller er dårlige – f.eks. estimering af fostervægt eller truende præterm fødsel. Forskning inden for AI-modeller har også fokuseret på at udvikle modeller, der kan give forklaringer, XAI (explainable AI) [25, 26], og på at bevæge sig væk fra de såkaldte »black box« AI-modeller, hvor det er uklart, hvad der driver modellens beslutninger. Hidtil har man forsøgt at forklare AI-modellers beslutninger ved hjælp af »heat maps«, der fremhæver de områder af et billede, som påvirker beslutningen. Nye metoder inden for XAI arbejder på at integrere koncepter i modellen såsom anatomiske landemærker, der kan bruges til at forklare klinikeren, hvorfor et billede f.eks. ikke er tilstrækkeligt godt, hvis det pågældende område ikke er tydeligt visualiseret [25].
Den transparente tilgang til samarbejdet mellem AI og kliniker hjælper også med at adressere de etiske overvejelser om ansvar i tilfælde af fejldiagnostik, da klinikeren har mulighed for at interagere med og kritisk evaluere AI-modellens beslutninger. Det er særlig vigtigt i føtalmedicin, hvor screeningsresultater kan føre til svære dilemmaer for patienten, f.eks. om man ønsker at fortsætte eller afbryde en graviditet, hvis der er alvorlige misdannelser.
Derudover hviler et betydeligt ansvar på udviklerne af AI-modellerne, da en model kun er så god som den data, modellen er trænet på. AI-modeller har ofte svært ved at generalisere til forskellige populationer [27], hvilket gør det afgørende, at modeller testes på forskellige datasæt [28, 29], og at deres begrænsninger er klart defineret og forstået før klinisk implementering. Derfor er det vigtigt, at vi værner om vores gode nationale registre og villigheden til at dele data, da gode AI-modeller gerne skal kunne håndtere alle typer af patienter, inklusive sjældne cases og forskellige demografiske karakteristika.
Som for andre områder kommer AI ikke til at erstatte klinikere i den føtalmedicinske UL-diagnostik, men klinikere, der bruger AI, kommer nok med tiden til at erstatte klinikere, der ikke bruger AI [30]. Men adgangen til data, implementeringsstudier og systematisk klinisk evaluering af kliniske AI-støtteredskaber kommer til at være essentielle for, at vi i fremtiden kan opnå den størst mulige værdi af AI i føtalmedicin – til gavn for både klinikere og de gravide.
Korrespondance Caroline Taksøe-Vester. E-mail: caroline.amalie.taksoee-vester@regionh.dk
Antaget 31. januar 2025
Publiceret på ugeskriftet.dk 28. april 2025
Interessekonflikter Der er anført potentielle interessekonflikter. Forfatternes ICMJE-formularer er tilgængelige sammen med artiklen på ugeskriftet.dk
Referencer findes i artiklen publiceret på ugeskriftet.dk
Artikelreference Ugeskr Læger 2025;187:V10240748
doi 10.61409/V10240748
Open Access under Creative Commons License CC BY-NC-ND 4.0
Ultrasound is essential in fetal medicine for diagnosing and monitoring, but it requires extensive training. Artificial intelligence (AI) shows a great promise in enhancing the clinical training and practice, by improving workflow and standardising diagnostics. Despite its potential, AI’s limitations and regulatory challenges must be addressed before full integration. Research should focus on implementation to achieve successful use in clinical practice. Ultimately, AI is expected to support clinicians rather than replace them, improving diagnostic accuracy and efficiency in fetal medicine.