Statusartikel

Kunstig intelligens ved øjensygdomme

Jakob Grauslund^1,^2,³& Henrik Vorum^4,⁵

27. nov. 2023

11 min.

Hovedbudskaber

Artiklens vigtigste nye budskaber

Oftalmologi er et speciale i rivende udvikling. Som følge af en tiltagende aldring af befolkningen samt nyopståede behandlingsmuligheder af en række vaskulære og degenerative øjenlidelser [1-3] har specialet gennem den seneste årrække overtaget førerpositionen som det medicinske speciale med flest patientkontakter [4]. Dette har samtidig øget fokus på muligheden for at introducere beslutningsstøttende værktøjer vha. kunstig intelligens. Potentialet heri beror især på den hyppige oftalmologiske brug af billeddiagnostiske undersøgelser, og at kunstig intelligens i de senere år har gennemgået en sand teknologiske revolution i takt med at deep learning-teknologien er modnet i en sådan grad, at automatisk billedanalyse på mange områder nu kan matche – eller endog overgå – den humane formåen. Denne udvikling opnåede sin foreløbige kulmination i 2018, da det første automatiske program blev godkendt af det amerikanske Food and Drug Agency til brug ved diabetisk øjenscreening [5].

I det følgende vil vi gennemgå udviklingen i brug af kunstig intelligens inden for en række oftalmologiske hovedområder. Fokus vil især være på sygdomme, hvor både sværhedsgrad og patientvolumen betinger, at der er brug for beslutningsværktøjer, som enten kan reducere humane input eller bedre den diagnostiske eller terapeutiske performance.

KUNSTIG INTELLIGENS SOM BILLEDDIAGNOSTISK VÆRKTØJ

Deep learning er den seneste genereration inden for kunstig intelligens og et særdeles velegnet værktøj til billedgenkendelse. Metoden er en undergruppe inden for maskinlæringsteknologien, som især har været fokuseret på at opstille automatiske algoritmer baseret på præprogrammerede input. Hvis man ønskede automatisk detektion af eksempelvis en blødning i nethinden, ville maskinlæring således kræve en række input, f.eks. størrelse, farve og form, som algoritmen skulle benytte til at identificere den ønskede læsion. Dette var et stærkt værktøj, som generelt havde en høj sensitivitet, men til gengæld en noget lavere specificitet. Inden for diabetisk øjenscreening opgjorde Nørgaard & Grauslund i et systematisk review således, at en række kommercielle maskinlæringsprogrammer havde sensitivitet på 87-95%, men blot specificitet på 50-69% [6]. Programmerne var således gode til at identificere de ønskede læsioner, men dette kom på en bekostning af et uacceptabelt højt antal falsk positive, hvilket reelt umuliggjorde den kliniske brug. Af samme årsag havde kunstig intelligens kun begrænset gennemslagskraft i slutningen af 1990’erne og første dekade af det nye årtusinde.

Situationen skulle dog ændre sig dramatisk, da den tiltagende computerregnekraft muliggjorde brugen af deep learning. Ved denne metode har computeren ikke brug for forprogrammerede input, men i stedet blot en lang række billeder påført det ønskede output. I eksemplet med en retinal blødning ville det således ikke længere være nødvendigt at programmere regler til identifikation af blødningen, men i stedet blot uploade en lang række billeder med fastlagt klassifikation (f.eks. retinale blødninger eller ej). Med en sådan markering af »ground-truth« lærer algoritmen selv at identificere den ønskede læsion på samme vis som ved human erfaringsmæssig indlæring [7]. Vha. talrige iterationer i dybe neurale netværk arbejder algoritmen sig langsomt fra en situation, hvor den intet kan genkende, til en voksende erkendelse af, hvorledes et bestemt billede skal identificeres. I denne proces justeres de interne parametre undervejs, så algoritmen tager mindre og mindre fejl, indtil den til sidst vil være i stand til at identificere ukendte billeder med både høj sensitivitet og specificitet [8]. Deep learning kræver således ikke forudgående programmering af de ønskede regler, men i stedet en meget høj mængde billeder med ground-truth-markering [9].

Inden for deep learning-teknologien skelnes mellem to hovedkategorier: klassifikation og segmentering. Ved klassifikation optrænes en algoritme, som er i stand til at kategorisere et givet billede i henhold til en benyttet reference. Dette kan eksempelvis være dikotom parameter, f.eks. glaukomsuspekt synsnerve eller ej, eller en anerkendt skala, f.eks. femtrinsskalaen, som benyttes til diabetisk øjenscreening i Danmark [10]. I modsætning hertil omhandler segmentering evnen til at kunne identificere givne læsioner på pixelniveau, f.eks. individuelle diabetiske nethindelæsioner (Figur 1) eller områder med makulært ødem på en optisk kohærens-tomografi (OCT).

DIABETISK RETINOPATI

Diabetisk retinopati (DR) er den hyppigste senkomplikation til diabetes [11] og blandt de førende årsager til synstab og blindhed blandt personer i den erhvervsaktive alder [12]. Livslang øjenscreening er indiceret hos alle patienter med diabetes [13], og i Danmark tilbydes dette i et nationalt screeningsprogram, der hvert år omfatter ca. 100.000 patienter med diabetes [10, 14].

Der har gennem en årrække været stort fokus på potentialet for at benytte kunstig intelligens ved diabetisk øjenscreening, da dette forventes at kunne medføre betydelige ressourcebesparelser. Dette har således været blandt de medicinske områder, hvor forskning i brug af kunstig intelligens har været længst fremme. Både deep learning-studier fra Gulshan et al [9] og Ting et al [15] påviste således, at det var muligt at udarbejde klassifikationsalgoritmer, som var i stand til at identificere svær DR med både sensitivitet og specificitet over 90%. Dette skabte efterfølgende forventning om, at det ville være nemt at benytte de tilgængelige kommercielle algoritmer i det danske screeningssystem. Der er dog fortsat en lang række barrierer til hinder for dette. For det første kan det være konceptuelt vanskeligt at forholde sig til et screeningsresultat, som matematisk er baseret på generel mønstergenkendelse frem for identifikation af givne læsioner. Desuden er deep learning-algoritmer ofte trænet på særligt egnede datasæt, som ikke nødvendigvis er repræsentative for den danske diabetespopulation, og som kan have resulteret i en algoritme, som performer dårligere i en klinisk situation, hvor billedmaterialet ikke nødvendigvis er optimalt. Endelig er de tilgængelige algoritmer designet til at identificere screeningspositive patienter med en tærskel, som ligger under den danske grænse for henvisning til behandling af synstruende DR. Ved indførelse i Danmark ville dette således medføre, at 90% af de screeningspositive patienter ville være falsk positive [16].

Andersen et al forsøgte at imødekomme dette ved udarbejdelse af en kombineret segmenterings- og klassifikationsalgoritme, som baseret på 34.075 segmenterede DR-læsioner og efterfølgende analyse af 31.325 fundusfotos var i stand til at identificere enkelte læsioner på niveau med en medicinsk ekspert og samtidig klassificere den eksakte DR-grad med en nøjagtighed på 70,4% [17]. Nissen et al benyttede efterfølgende en machine learning-model til at foretage en binær klassifikation af tilstedeværelse eller fravær af DR blandt 1.001 diabetiske øjne [18]. Algoritmen udmærkede sig især ved en høj sensitivitet (97,0%), hvilket giver muligheder for at anvende programmet som beslutningsstøtteværktøj med særligt potentiale for at frasortere øjne uden DR (78% i det danske screeningssystem [14]), hvormed en human grader vil kunne fokusere på at klassificere øjne med DR.

En række danske studier arbejder fortsat på udarbejdelse af algoritmer, som vil kunne implementeres i det danske sundhedssystem, hvor potentialet både er, at automatisk billedanalyse kan identificere screeningspositive patienter og samtidig være med til at prædiktere fremtidig risiko for udvikling af både okulære og systemiske senkomplikationer som neuropati, nefropati og kardiovaskulær sygdom. En sådan risikostratificering vil kunne fremme brugen af individualiseret behandling.

ALDERSRELATERET MACULADEGENERATION

Aldersrelateret maculadegeneration (AMD) er en degenerativ nethindesygdom, hvis senstadier inkluderer våd AMD og svær tør AMD med makulær geografisk atrofi, som i 2040 forventes at afficere hhv. 58.000 og 41.000 danskere [19]. Selvom de seneste 15 års mulighed for at behandle våd AMD har medført en halvering af antallet af nyblinde ældre i Danmark [20], beslaglægger sygdommen fortsat enorme ressourcer for patienter og sundhedsvæsenet. Således påviste Brynskov et al i en langtidsopfølgning fra Roskilde, at patienter med våd AMD trods et årligt behandlingsbehov på 4,0-5,4 medicininjektioner kan se frem til et synstab på 5,0 bogstaver på synstavlen [21].

Potapenko et al har arbejdet med deep learning-modeller, som potentielt kan aflaste den kliniske beslutningstager. Med en algoritme trænet på 50.439 OCT’er lykkedes det at detektere makulært ødem med samme nøjagtighed på 90,9% som ved klinisk beslutningstagen [22]. Ligeledes kunne algoritmen træffe selvstændige beslutninger i 73% af tilfældene, hvoraf 91,8% var på niveau med en klinisk ekspert [23].

Internationalt har der især været stort fokus på udarbejdelse af segmenteringsalgoritmer til detektion af makulært ødem ved våd AMD. Schmidt-Erfurt et al konstruerede således en algoritme, som kunne omsætte todimensionelle OCT’er til tredimensionelle målinger af væskevolumen i de forskellige retinale spalterum [24]. Gruppen påviste efterfølgende, at algoritmen samtidig gav mulighed for at integrere disse målinger med kliniske data og dermed opnår en prædiktion af rette behandlingsregime på 87% [25]. Dette kan hjælpe med at sikre en bedre klinisk vurdering af sygdomsaktivitet og dermed optimere muligheden for at individualisere behandlingen ved våd AMD.

KUNSTIG INTELLIGENS INDEN FOR ANDRE OFTALMOLOGISKE SYGDOMME

Selvom der især har været fokus på brug af kunstig intelligens inden for DR og AMD, er der også en betydelig forskningsaktivitet inden for andre oftalmologiske sygdomme. Glaukom er en hyppig øjenlidelse, som både kan være vanskelig at diagnosticere og behandle. I et systematisk review påviste Mirzania et al 29 studier, som baseret på kunstig intelligens på forskellig vis har adresseret diagnosticering af glaukom [26]. Disse studier var hhv. baseret på diagnosticering ved fundusfotografering, OCT og synsfeltsanalyse, men der mangler fortsat valideringsstudier, som integrerer alle disse modaliteter på samme vis som i en klinisk beslutningsproces.

Præmaturitetsretinopati er en synstruende lidelse, som især skyldes iltbehandling hos svært præmature. Screening er indiceret hos nyfødte i høj risiko, men undersøgelsen er teknisk svær, og der har derfor været en del fokus på at skabe et diagnostisk værktøj baseret på kunstig intelligens. Campell et al udviklede til dette formål en egnet algoritme, som var i stand til at detektere behandlingskrævende sygdom med sensitivitet og specificitet på hhv. 100% og 78%. Dette vækker optimisme i forhold til muligheden for at integrere sådanne algoritmer i de kameraer, som benyttes til formålet.

Sluttelig forskes der med dansk deltagelse i automatisk påvisning af papilødem, hvor Milea et al i et datasæt på 14.341 synsnervefotos var i stand til at detektere papilødem med sensitivitet og specificitet på hhv. 93,2% og 95,1% [27].

KONKLUSION

Kunstig intelligens er et udviklingsfelt i rivende udvikling inden for oftalmologien. De første algoritmer er allerede godkendt til kommercielt brug, og der arbejdes aktivt på adaptationer, som muliggør dansk brug. På trods af imponerende diagnostisk performance opnået med især deep learning-teknologien er det vigtigt med opfølgende valideringsstudier, som kan være med til at sikre nødvendig klinisk implementering, som kan hjælpe med bedre diagnostisk performance og reducere kliniske humane ressourcer. Ligeledes er det vigtigt med aktiv stillingtagen til, hvorledes man skal forholde sig til kliniske og juridiske problemstillinger i forhold til beslutningstagen ved f.eks. nedsat billedkvalitet, klassifikation af sygdomslæsioner på tværs af sygdomme (f.eks. ved nethindeblødninger) og ansvarsplacering ved ukorrekt diagnosticering.

Korrespondance Jakob Grauslund. E-mail: jakob.grauslund@rsyd.dk

Antaget 24. maj 2023

Publiceret på ugeskriftet.dk 27. november 2023

Interessekonflikter Der er anført potentielle interessekonflikter. Forfatternes ICMJE-formularer er tilgængelige sammen med artiklen på ugeskriftet.dk

Referencer findes i artiklen publiceret på ugeskriftet.dk

Artikelreference Ugeskr Læger 2023;185:V03230169

Summary

Artificial intelligence within ophthalmologic diseases

Jakob Grauslund & Henrik Vorum

Ugeskr Læger 2023;185:V03230169

As ophthalmology is an increasingly busy medical specialty relying solidly on imaging technology, this review investigates the introduction of artificial intelligence to improve diagnostic performance and reduce human resources. In diabetic retinopathy screening, algorithms are now regulatory-approved for international markets but not yet tailored for the Danish system. In age-related macular degeneration, algorithms are now able to facilitate the classification and segmentation of disease activity, and in upcoming years, these are likely to assist us to improve diagnosis and provide subsequent clinical care.

Referencer

Rosenfeld PJ, Brown DM, Heier JS et al. Ranibizumab for neovascular age-related macular degeneration. N Engl J Med. 2006;355(14):1419-31.
Brown DM, Nguyen QD, Marcus DM et al. Long-term outcomes of ranibizumab therapy for diabetic macular edema: the 36-month results from two phase III trials: RISE and RIDE. Ophthalmology. 2013;120(10):2013-22.
Campochiaro PA, Brown DM, Awh CC et al. Sustained benefits from ranibizumab for macular edema following central retinal vein occlusion: twelve-month outcomes of a phase III study. Ophthalmology. 2011;118(10):2041-9.
NHS 75 Digital. Hospital Outpatient Activity 2020-21, 2021. https://digital.nhs.uk/data-and-information/publications/statistical/hospital-outpatient-activity/2020-21/summary-report---treatment-specialities (21. jun 2023).
Abràmoff MD, Lavin PT, Birch M et al. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ Digit Med. 2018;1:39.
Nørgaard MF, Grauslund J. Automated screening for diabetic retinopathy – a systematic review. Ophthalmic Res. 2018;60(1):9-17.
LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436-44.
Nielsen KB, Lautrup ML, Andersen JKH et al. Deep learning-based algorithms in screening of diabetic retinopathy: a systematic review of diagnostic performance. Ophthalmol Retina. 2019;3(4):294-304.
Gulshan V, Peng L, Coram M et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. JAMA. 2016;316(22):2402-2410.
Grauslund J, Andersen N, Andresen J et al. Evidence-based Danish guidelines for screening of diabetic retinopathy. Acta Ophthalmol. 2018;96(8):763-769.
Grauslund J, Green A, Sjølie AK. Prevalence and 25 year incidence of proliferative retinopathy among Danish type 1 diabetic patients. Diabetologia. 2009;52(9):1829-35.
Grauslund J, Green A, Sjølie AK. Blindness in a 25-year follow-up of a population-based cohort of Danish type 1 diabetic patients. Ophthalmology. 2009;116(11):2170-4.
Stefánsson E, Bek T, Porta M et al. Screening and prevention of diabetic blindness. Acta Ophthalmol Scand. 2000;78(4):374-85.
Andersen N, Hjortdal JØ, Schielke KC et al. The Danish Registry of Diabetic Retinopathy. Clin Epidemiol. 2016;8:613-619.
Ting DSW, Cheung CYL, Lim G et al. Development and validation of a deep learning system for diabetic retinopathy and related eye diseases using retinal images from multiethnic populations with diabetes. JAMA. 2017;318(22):2211-2223.
Grauslund J, Andersen N, Andresen J et al. Reply: is automated screening for DR indeed not yet ready as stated by Grauslund et al? Acta Ophthalmol. 2020;98(2):e258.
Andersen JKH, Hubel MS, Rasmussen ML et al. Automatic detection of abnormalities and grading of diabetic retinopathy in 6-field retinal images: integration of segmentation into classification. Transl Vis Sci Technol. 2022;11(6):19.
Nissen T, Vestergaard P, Schielke KC et al. Performance evaluation of software-assisted diabetic retinopathy screening. Eur J Ophthalmol. 2021;31:38-9.
Sedeh FB, Scott DAR, Subhi Y, Sørensen TL. Prevalence of neovascular age-related macular degeneration and geographic atrophy in Denmark. Dan Med J. 2017;64(11):A5422.
Bloch SB, Larsen M, Munch IC. Incidence of legal blindness from age-related macular degeneration in Denmark: year 2000 to 2010. Am J Ophthalmol. 2012;153(2):209-13.e2.
Brynskov T, Munch IC, Larsen TM et al. Real-world 10-year experiences with intravitreal treatment with ranibizumab and aflibercept for neovascular age-related macular degeneration. Acta Ophthalmol. 2020;98(2):132-138.
Potapenko I, Kristensen M, Thiesson B et al. Detection of oedema on optical coherence tomography images using deep learning model trained on noisy clinical data. Acta Ophthalmol. 2022;100(1):103-110.
Potapenko I, Thiesson B, Kristensen M et al. Automated artificial intelligence-based system for clinical follow-up of patients with age-related macular degeneration. Acta Ophthalmol. 2022;100(8):927-936.
Schmidt-Erfurth U, Vogl WD, Jampol LM et al. Application of automated quantification of fluid volumes to anti-VEGF therapy of neovascular age-related macular degeneration. Ophthalmology. 2020;127(9):1211-1219.
Bogunovíc H, Mares V, Reiter GS, Schmidt-Erfurth U. Predicting treat-and-extend outcomes and treatment intervals in neovascular age-related macular degeneration from retinal optical coherence tomography using artificial intelligence. Front Med (Lausanne). 2022;9:958469.
Mirzania D, Thompson AC, Muir KW. Applications of deep learning in detection of glaucoma: a systematic review. Eur J Ophthalmol. 2021;31(4):1618-1642.
Milea D, Najjar RP, Zhubo J et al. Artificial intelligence to detect papilledema from ocular fundus photographs. N Engl J Med. 2020;382(18):1687-1695.