Forudsigelse af individuelle levetider ved hjælp af statistiske modeller

Klinikere får mange henvendelser fra patienter og pårørende, som beder om forudsigelse af individuelle levetider efter diagnose af en mulig terminal lidelse. Christakis & Lamont [1] og Glare et al [2] undersøgte nøjagtigheden af klinisk forudsigelse af overlevelse og fandt dårlig overensstemmelse med faktisk overlevelse. I en kommentar til [1] hævdede kirurgen Parkes (som har arbejdet med disse ting i over 30 år) [3], at brugen af omhyggeligt udviklede statistiske indices ville kunne forbedre denne situation betragteligt.

Hovedtesen i dette bidrag er en understregning af, at i alle realistiske situationer, som vi kan forestille os, vil den iboende statistiske variation i levetiderne være så stor, at forudsigelser baseret på statistiske modeller og indices har meget begrænset nytte for den enkelte patient. Den ovenfor citerede usikkerhed i klinisk forudsigelse af overlevelse [1, 2] er ikke meget værre, end hvad man ville få ved brug selv af den teoretisk bedst mulige forudsigelse baseret på statistiske modeller, i det mindste for de overlevelsesmønstre, som vi har erfaring med.

Selv om dette kan være en trøst for en kliniker, som står over for urealistiske krav om præcision fra bekymrede patienter og pårørende, er der adskillige sammenhænge hvori denne iboende variabilitet kan have konsekvenser, som kræver nærmere overvejelse. Blandt disse er, hvordan man kan formulere forebyggelseskampagner i folkesundheden (hvor interventionen nødvendigvis må være individuel), hvorledes man kan håndtere meget specifikke krav om begrænset restlevetid for terminalt syge patienter i hospice-programmer eller ved ansøgning om plejeorlov for pårørende samt i erstatningssituationer, hvor en faktisk realiseret restlevetid efter en suboptimal behandling skal sammenlignes med en individuel forudsigelse under optimal behandling [4].

Illustrative data

Til illustration vil vi benytte data fra en undersøgelse om nøjagtighed af restlevetidsforudsigelse for patienter diagnosticeret med ikkesmåcellet lungecancer [5] diskuteret af Henderson et al [6]. Vi koncentrerer os her om de 272 patienter, for hvilke fuldstændige oplysninger fandtes om følgende risikofaktorer: alder, køn, aktivitetsscore, anoreksi, hæshed og metastaser. Omkring 17% af patienterne var stadig i live ved followup og leverede derfor censurerede overlevelsestider, resten døde alle inden for 30 måneder efter diagnosen. Ved bedømmelsen af forudsigelsesnøjagtigheden for patienter med censurerede levetider imputerede vi de censurerede levetider ved til censureringstidspunktet at addere den mediane restlevetid for den pågældende patient som estimeret ud fra den statistiske model. I Tabel 1 ses en oversigt over effekterne af risikofaktorerne under en sædvanlig Cox proportional hazards-model. På basis af disse resultater kan man konstruere et prognostisk indeks (PI), som i et enkelt tal samler den kombinerede effekt af en patients risikofaktorer og ofte bruges til at beskrive individets risiko. For en 70-årig mandlig patient med aktivitetsscore 3, anoreksi, hæshed, men ingen metastaser, vil koefficienterne i Tabel 1 give det prognostiske indeks:

PI = 0,010 × 70 - 0,685 × 1 + 0,346 × 3 + 0,314 × 1 + 0,680 × 1 + 0,417 × 0 = 2,047.

For at lette fortolkningen kan man fratrække den mediane PI og derefter tage eksponentialfunktionen af PI, hvilket giver den relative risiko for hver patient sammenlignet med en »typisk« patient. For lungekræftpatienterne er det mediane prognostiske indeks 1,117, og den relative risiko for patienten ovenfor er 2,53. I alt fem patienter (alle med aktivitetsscore 3 eller 4) havde relative risici i området 4-8 og resten havde værdier mellem 0,3 og 4.

Ved også at inddrage Cox-modellens estimerede underliggende intensitet kan der frembringes en overlevelseskurve for hver patient (Figur 1 ). Den statistiske signifikans af risikofaktorerne, den betydelige variation af den relative risiko og den klare forskel mellem kurverne i Figur 1 viser tilsammen, at man med den statistiske model bliver i stand til at skelne mellem patienterne med hensyn til deres overlevelses sandsynlighed. I de følgende afsnit undersøges det, om dette også gælder for forudsigelse af individuelle restlevetider.

Point predictions

En point prediction (på dansk måske punktforudsigelse) er et enkelt tal, som angiver forudsigelsen af overlevelsestiden. Efter udeladelse af tilfælde, som ikke kunne klassificeres på grund af censureret faktisk overlevelse, faldt 49% af klinikernes forudsigelser for lungekræftpatienterne i Parkes' [3] definition af serious error, hvilket vil sige, at forudsigelsen enten er mindre end halvdelen af overlevelsestiden eller mere end dobbelt så lang som overlevelsestiden.

På baggrund af denne lidet opmuntrende effektivitet af klinikernes evne til at forudsige levetid analyserede vi disse data i det håb, at vi kunne finde en statistisk model, som kunne levere objektive forudsigelser baseret på individuelle risikofaktorer, idet vi begyndte med den sædvanlige Cox proportional hazards-model, som vi kort beskrev ovenfor. Selv om de pågældende risikofaktorer var stærkt statistisk signifikante, var individuelle forudsigelser fra denne model også ringe: 52% var i Parkes' serious error-kategori.

Vi så på en række parametriske og semiparametriske alternativer til Cox proportional hazards-modellen (Cox-, Weibull- og lognormal-underliggende intensitet, med og uden frailty ). Hvad angår forudsigelse, inkluderer den bedste model, vi kunne finde, klinikerens forudsigelse som yderligere risikofaktor og udnytter således subjektiv information i den kliniske forudsigelse af overlevelse. Vi udelader detaljerne, men vil dog nævne, at 47% af forudsigelserne stadig var
i serious error -kategorien.

Med Parkes' definition af serious error godkender man generøst mange forudsagte værdier ved sammenligning med faktisk overlevelse. Selv med den var omkring halvdelen af de statistiske forudsigelser forkerte, og de statistiske forudsigelser var ikke klart bedre end de kliniske. Denne situation er typisk. I analyser af en række andre data (ikke rapporteret her) var fejlraterne for statistiske prædiktioner også typisk 50-60%. At det går så dårligt, bør ikke overraske: hvis vi for argumentets skyld antager, at den statistiske model er fuldstændig korrekt, således at der ikke indgår nogen estimationsusikkerhed i billedet, kan man vise matematisk, at den forventede bedste serious error -rate sædvanligvis vil være omkring 50% for de overlevelseskurver, man sædvanligvis ser i virkeligheden [6].

Prædiktionsintervaller

På basis af overlevelseskurverne kan man direkte udlede prædiktionsintervaller, som for hver patient specificerer et område, inden for hvilket den faktiske overlevelsestid vil befinde sig med en specificeret sandsynlighed på tilsvarende måde som et konfidensinterval. Sådanne intervalestimater kvantificerer usikkerheden i forudsigelserne, men vores erfaring er,
at intervallerne som regel er for store til at være til særlig praktisk nytte. I Tabel 2 vises 95%- og 80%-prædiktionsintervaller for patienter med overlevelseskurver svarende til dem i Figur 1. Der er betragtelig usikkerhed i forudsigelsen selv for patienten med meget høj risiko og dårlig prognose.

Rate-ratioer

Vores argument er, at statistiske indices giver dårlig mulighed for at skelne på individniveau. Endnu en måde at illustrere dette på er at betragte to patienter, en med lav risiko og en med høj risiko og antage, at deres dødsrater adskiller sig med en proportionalitetsfaktor θ> 1. Man kan så vise, at sandsynligheden for, at højrisikopatienten vil leve længere end lavrisikopatienten, er 1/(1 + θ ), eller ækvivalent rate-ratioen θ er lig odds for, at højrisikopatienten dør før lavrisikopatienten.
I Tabel 3 vises karakteristiske værdier af rate-ratioen og den tilsvarende sandsynlighed for, at lavrisikopatienten lever længere end højrisikopatienten. For at sætte disse værdier i perspektiv for patienterne i Figur 1 ses i Tabel 4 relativ risiko for de tre patientgrupper.

Rate-ratioen for en patient med meget høj risiko sammenlignet med en patient med meget lav risiko er θ = 2,35/0,56 = 4,2. Selv for dette ganske ekstreme eksempel har lavrisikopatienten en langtfra uvæsentlig sandsynlighed på 19% for at leve kortere end højrisikopatienten.

Diskussion

Hverken klinikere eller statistikere kunne levere pålidelige forudsigelser af overlevelsestid for cancerpatienterne. Selv om vi kun har brugt et enkelt eksempel til illustration, er det vores opfattelse, at dårlig forudsigelsesnøjagtighed ligger i sagens natur for realistiske overlevelsesmønstre. Kliniske forudsigelser vil ganske vist oftest være klart statistisk korrelerede med faktisk overlevelse [2], og statistiske modeller kan vise stærkt statistisk signifikante effekter af baggrundsvariable, men hverken korrelation eller signifikans garanterer i sig selv præcise forudsigelser.

Billedet skifter, når man betragter populationskarakteristika. Her kan en omhyggeligt konstrueret statistisk model være værdifuld til at forudsige overlevelsessandsynligheder med såvel som til at estimere effekterne af behandling eller demografiske karakteristika med. I Tabel 5 forsøges givet en oversigt over en række anvendelser af forudsigelser af levetider fra individets og befolkningens synspunkt. Prognostiske indices eller såkaldte palliative scorer kan være nyttige til at placere patienter i risikogrupper, og fra visse synspunkter, måske forsikringsmæssige, er alt, hvad der er nødvendigt at kende, den andel af hver gruppe, som på hvert givet tidspunkt vil overleve. En forskel mellem grupper på f.eks. 10% pr. år i overlevelsessandsynlighed kan i sådanne tilfælde være overordentlig vigtig. Men for den individuelle patient er vores synspunkt, at en sådan forskel mellem grupper er lille i forhold til variabiliteten i levetid selv mellem patienter med ens karakteristika.

Hvilket svar skal klinikeren nu give på den kritisk syge patients ønske om information? Som fremhævet mere generelt af Hollnagel [7] er det vigtigt at informere patienter om individuel usikkerhed, mens man samtidig meddeler populationsbaseret viden og erfaring. For levetider betyder det, at man må opgive at anvende et enkelt tal til at karakterisere en sandsynlighedsfordeling, om det så er en punktforudsigelse, et prognostisk indeks, en relativ risiko eller en sandsynlighed for at overleve et givent stykke tid. Prædiktionsintervaller, som vist i Tabel 2, er som regel for brede til at være nyttige til at forudsige overlevelsestider med. En anden mulighed er at give tre tidsintervaller med samme sandsynlighed og parafrasere Hollnagels teknik til at kommunikere information i et klart og relevant sprog. For medianrisikopatienten i Tabel 2 ville det være:

»Hvis man følger en gruppe på 90 patienter som dig, viser forskningen, at 30 vil dø inden fire måneder, 30 vil dø mellem fire måneder og 11 måneder fra nu, og 30 vil dø efter mere end 11 måneder. Jeg ved ikke hvilken gruppe, du tilhører«.

At kommunikere sådan information effektivt ville måske være det bedste kompromis mellem at skaffe patienten præcis information og undgå det ubegrundede indtryk af præcision, som ofte vil ligge i forudsigelser i et enkelt tal.

Niels Keiding, Biostatistisk Afdeling, Institut for Folkesundhedsvidenskab, Københavns Universitet, Blegdamsvej 3, DK-2200 København N. E-mail: N.Keiding@biostat.ku.dk

Antaget: 30. september 2004

Interessekonflikter: Ingen angivet

Taksigelse: Vi takker Margaret Jones for adgang til lung ekræftdata.

Forudsigelse af individuelle levetider ved hjælp af statistiske modeller

Forudsigelse af individuelle levetider ved hjælp af statistiske modeller

Summary

Referencer