Fra arkiv

Hvorledes afrapporteres risiko?

Overlæge Gunnar Lauge Nielsen, overlæge Ulrik Tage-Jensen, professor Torsten Toftegaard Nielsen & professor Henrik Toft Sørensen Aalborg Sygehus, Klinisk Epidemiologisk Afdeling, Medicinsk Gastroenterologisk Afdeling, og Århus Universitetshospital, Skejby Sygehus, Hjertemedicinsk Afdeling B

1. nov. 2005

15 min.

Begreberne absolut risiko, relativ risiko, risikodifferens og number needed to treat (NNT), number needed to harm (NNH) eller number needed to screen (NNS), der hyppigt benyttes ved afrapportering af risiko på individniveau, defineres og illustreres med tal fra Scandinavian Simvastatin Survival Study Group (4-S)-undersøgelsen. Med henblik på at vurdere de samfundsmæssige konsekvenser af forskellige interventioner defineres begreberne ætiologisk fraktion illustreret med data fra WOSCOPS-undersøgelsen, samt disease impact number og population impact number (DIP). Sidstnævnte illustreres med gevinsten ved forskellige interventioner hos patienter med apoplexia cerebri. Der gives forslag til en tabel, der indeholder de væsentligste risikomål.

Fortolkningen af resultater fra klinisk kontrollerede forsøg og observerende studier samt beslutningen om, hvilke konsekvenser resultaterne skal have for ændringer i daglig praksis, giver ofte anledning til debat.

Vi vil i oversigtsform gennemgå de hyppigst benyttede associationsmål illustreret primært med tal fra Scandinavian Simvastatin Survival Study Group (4-S)-undersøgelsen, der var det første interventionsstudie, hvori man dokumenterede effekt på totaldødeligheden af medikamentel kolesterolreduktion hos højrisikopatienter med tidligere blodprop i hjertet (AMI) [1].

Herefter giver vi i tabelform forslag til en datapræsentation, der vil lette beslutningstagernes vurdering af resultaterne fra kontrollerede forsøg.

De omtalte begreber tolkes på samme vis ved undersøgelser af effekten af screening og forebyggelse.

Absolut risiko

Absolut risiko (AR) defineres som:

og besvarer spørgsmålet: »Hvor hyppigt optræder udfaldet (i 4-S: død uanset årsag) hos ubehandlede i en defineret tidsperiode?«

I 4-S-studiet var kontrolgruppens kumulerede risiko for død 11,5% i løbet af observationstiden på 5,4 år.

Relativ risiko

Relativ risiko (RR) defineres som:

og besvarer spørgsmålet: »Hvor mange gange større eller mindre er risikoen for et givet udfald blandt behandlede end blandt ikkebehandlede kontrolpersoner?«

I 4-S-studiet var RR for død 0,71, nemlig 8,2% blandt behandlede og 11,5% i den ubehandlede kontrolgruppe. Sagt på en anden måde medførte behandling med kolesterolsænkende medicin en relativ risikoreduktion på 29%.

I randomiserede forsøg og kohortestudier med fikseret og komplet opfølgning i både interventions- og kontrolgruppen er behandlings- og observationstiden ofte tilnærmelsesvis ens i de to grupper. Da risikotiden er ens, bliver RR således forholdet (ratio) mellem det kumulerede antal udfald i henholdsvis behandlings- og kontrolgruppen i løbet af observationstiden.

De fleste længerevarende kohortestudier omfatter dynamiske populationer, dvs. at hver enkelt person bidrager med forskellig observationstid, hvor vedkommende er i risiko for at opleve det pågældende udfald. I denne type undersøgelser er det derfor vigtigt, at antallet af udfald sættes i relation til den kumulerede risikotid. For eksempel kan man opgøre antallet af nye dødsfald pr. 1.000 behandlings- eller observationsår i hhv. interventions- og kontrolgruppen, hvorefter incidensrate-ratioen kan beregnes.

Den enkelte persons chance for gevinst ved behandling øges ved stigende RR, f.eks. giver det større individuel behandlingsgevinst ved stigende kolesterolværdier [2]. I et samfundsmæssigt perspektiv vil gevinsten ved f.eks. kolesterolreduktion derimod aftage i takt med, at interventionen indsnævres til en stadigt mindre gruppe med stigende risiko. Langt hovedparten af de dødsfald, der kan forebygges ved behandling, vil ligge i området med kun let til moderat forhøjede kolesterolværdier, altså uden for målgruppen ved en højrisikostrategi [3].

I samfundsperspektiv vil RR således ikke kunne bruges som eneste faktor til at give en udtømmende beskrivelse af gevinsten af en given behandling med. En sådan vurdering vil forudsætte kendskab til bl.a. hyppigheden af den pågældende risikofaktor i befolkningen, befolkningens alderssammensætning og den forventede behandlingsvarighed [4].

RR kan således primært anvendes, når styrken i årsagssammenhænge skal beskrives, og når højrisikogrupper, hvor den enkelte har størst gevinst af behandlingen, skal udpeges. Som eneste associationsmål giver udtrykket derimod kun begrænset information om den samfundsmæssige gevinst.

Risikodifferens

Risikodifferens (RD) defineres som:

»proportion af udfald i interventionsgruppen i observations-tiden« minus »proportion af udfald i kontrolgruppen i observationstiden«

og besvarer spørgsmålet: »Hvor meget større eller mindre er sandsynligheden for et givet udfald i interventionsgruppen i forhold til kontrolgruppen?«

I 4-S-studiet indtrådte der 11,5% dødsfald i kontrolgruppen og 8,2% i interventionsgruppen. RD, også kaldet absolut risiko-reduktion, var således 3,3%.

Number needed to treat, number needed to harm
eller number needed to screen

På basis af RD kan man beregne det antal patienter, der pr. tidsenhed skal behandles eller undersøges (f.eks. screenes) for at undgå et uønsket udfald eller fremkalde en interventionsforårsaget bivirkning:

Ved akutte tilstande, hvor behandlingen (f.eks. trombolyse ved AMI) kun gives i kort tid, hvorefter patienterne enten oplever udfaldet eller bliver raske, er brugen af number needed to treat (NNT) og number needed to harm (NNH) relativt ukompliceret, da tidsfaktoren er kort, og stort set alle konsekvenser af interventionen udspiller sig inden for dette tidsrum.

Ved længerevarende interventioner (f.eks. medikamentel behandling af forhøjet kolesterol) skal observationstiden medinddrages for at få et mere fyldestgørende billede af effekten, f.eks. NNT pr. antal behandlingsår.

I 4-S-studiet var NNT 30,3 (100:3,3), men da alle patienter blev behandlet i gennemsnitlig 5,4 år, forudsætter forebyggelse af et dødsfald behandling med kolesterolsænkende medicin i i alt 164 personår.

Baggrunden for at in troducere begrebet NNT og NNH var ønsket om at kunne summere effekten af en given intervention i et enkelt tal, altså en currency for making decisions [5, 6]. Hvad er f.eks. NNT ved behandling af højt blodtryk med diuretika frem for betablokkere, reduktion af kolesterol med forskellige lipidsænkere eller number needed to screen (NNS) for at undgå et dødsfald af brystkræft sammenlignet med f.eks. et dødsfald af kolorektal kræft [7]?

NNT/NNH eller NNS fremstår således umiddelbart som et enkelt og let forståeligt tal til brug ved sammenligning af forskellige interventioner.

NNT beregnes imidlertid, ganske som RD, ved optælling af udfald på et givet tidspunkt. Ingen af de to tal indeholder således information om forløbet i den mellemliggende periode. En mere korrekt definition af NNT ved langvarige interventioner vil derfor være: »det gennemsnitlige antal personer, der skal behandles i en tidsperiode for at undgå et udfald på optællingstidspunktet« [8].

Hverken ved beregning af NNT eller RD på et fastsat tidspunkt vil man således udnytte informationerne om forløbet af de underliggende overlevelseskurver, f.eks. om hele effekten udspilles kort efter interventionen, eller om en eventuel gevinst først indtræder tæt på tidspunktet for måling af effekten. Forskellige måletidspunkter kan derfor føre til varierende NNT for samme intervention [9]. Det umiddelbart enkle og forståelige budskab bliver således sværere at tolke.

Informationen fra tidsforløbet vil bedre kunne udnyttes, hvis NNT beregnes som den reciprokke værdi af incidensraten (hazard rate ), altså sandsynligheden for at opleve udfaldet som præcis funktion af den underliggende risikotid [10]. NNT beregnet med denne metode vil ofte være lavere end NNT beregnet på et fikseret tidspunkt.

NNT, NNH og NNS inkluderer ikke oplysninger om økonomi eller andre problemer med at gennemføre interventionerne. For eksempel må screening for fenylketonuri trods et højt NNS på ca. 2.500 betragtes som omkostningseffektivt, da screeningen er enkel, og behandlingen sikrer en normal livslængde [11].

Trods disse problemer vil de fleste læger nok intuitivt føle, at en besked til en patient om, at forebyggelse af et nyt sygdomstilfælde vil kræve behandling i enten f.eks. 30 personår eller 300 personår, trods alt vil være mere informativ end blot besked om, at behandling kan reducere risikoen for sygdom med f.eks. 25%. Heroverfor står dog, at man i en dansk undersøgelse omfattende interview med 675 raske lægfolk fandt, at information om behandlinger i form af NNT varierende fra 10 til 400 ikke havde nævneværdig indflydelse på de adspurgtes til- eller fravalg af aktiv behandling. Dette kan enten skyldes, at de ikke kunne gennemskue betydningen af begrebet NNT, eller at beslutning om evt. behandling træffes på helt andre præmisser [8].

NNT, NNH og NNS er således udmærkede redskaber, når gevinsten eller risikoen ved kortvarige interventioner skal sammenlignes, og må i disse situationer betragtes som et nødvendig supplement til oplysning om AR og RR.

Udtrykket har derimod klare begrænsninger, hvis man sammenligner effekten af interventioner givet ved kroniske tilstande eller sammenligner principielt forskellige interventioner givet til forskellige patientkategorier.

Sygdomsfri overlevelse

Det har været foreslået, at behandlingseffekten ved kroniske sygdomme med forventet behandling indtil død, bedst afrapporteres som gennemsnitlig restlevetid, f.eks. målt som areal under overlevelseskurverne i hhv. interventions- og kontrolgrupperne [4, 12]. Herudfra vil man så kunne beregne absolutte og relative værdier for sygdomsfri overlevelse (time to event eller gain in life expectancy ). Disse beregninger forudsætter imidlertid i princippet observation, indtil alle har oplevet effektmålet (ultimativt at alle er døde), eller i det mindste indtil der foreligger data, der muliggør relativt sikre ekstrapolationer af overlevelseskurverne ud over observationstiden.

Ud fra data i de enkelte artikler er det sædvanligvis ikke muligt umiddelbart at beregne varighed af sygdomsfri overlevelse. I langt de fleste tilfælde er observationstiden i de tilgrundliggende studier også meget kortere end den gennemsnitlige restlevetid, hvorfor ekstrapolation af restlevetid vil være behæftet med meget stor usikkerhed. Selv om sygdomsfri overlevelse således vil kunne give ret præcist svar på, med hvor mange ekstra måneder en patients restlevetid vil kunne forlænges ved en given behandling, er det et riskomål, der desværre kun sjældent kan fremskaffes [10].

Ætiologisk fraktion

I et samfundsmæssigt perspektiv vil det være af interesse at kunne beregne, hvor stor en del af sygeligheden i befolkningen, der kan tilskrives en risikofaktor. For eksempel hvor mange tilfælde af AMI, der vil kunne forebygges ved at nedsætte kolesterolniveauet i befolkningen.

Den ætiologiske fraktion kan beregnes som hhv. population attributable risk:

RD × prævalens af risikofaktoren i befolkningen

der besvarer spørgsmålet om, hvor mange personer i en befolkning, der får en given sygdom på grund af tilstedeværelsen af en bestemt risikofaktor, og population attributable fraction:

der giver svar på spørgsmålet om, »hvor stor en andel af nye tilfælde af en given sygdom i befolkningen, der kan tilskrives en bestemt risikofaktor?«

Disse beregninger forudsætter kendskab til RD, prævalens af risikofaktoren og incidensraten for den pågældende sygdom i den undersøgte befolkning.

Sådanne oplysninger foreligger kun sjældent. 4-S-studiet omfattede således kun en højrisikogruppe. Vi har i stedet valgt at illustrere ætiologisk fraktion med tal fra WOSCOPS. Denne undersøgelse omfattede primær prævention hos hjerteraske skotske 45-64-årige mænd, der efter en periode med kostvejledning havde LDL over 4,0 mmol pr. liter [13]. Antallet af non-fatale AMI eller kardiovaskulære dødsfald efter fem års behandling af 3.300 personer var hhv. 5,5% (n = 174) og 7,9% (n = 248) i interventions- og kontrolgrupperne, svarende til en risikodifferens på 2,4% (74 sparede udfald pr. 16.500 behandlingsår).

Ved brug af beregningsmetoder som anført i Rothman (14) bliver population attributable fraction 0,18. Dvs. at i en population svarende til WOSCOPS vil primær profylaktisk medikamentel behandling med kolesterolsænker kunne forebygge ca. 27 non-fatale AMI eller kardiovaskulære dødsfald pr. 10.000 behandlede personår (18% af 150 incidente tilfælde pr. 10.000 personår).

Den ætiologiske fraktion bidrager således til at beskrive, hvilke interventioner der vil kunne få størst effekt på samfundsniveau. Fjernelse af en relativt svag, men hyppigt optrædende risikofaktor, vil kunne få stor betydning for befolkningens samlede sundhedstilstand, hvorimod elimination af en meget stærk, men sjældent optrædende ætiologisk risikofaktor kun vil få meget beskeden samfundsmæssig (men naturligvis stor individuel) konsekvens.

Alle ovennævnte risikomål bygger oftest på randomiserede undersøgelser med snævre in- og eksklusionskriterier, hvorfor resultaterne principielt kun kan generaliseres til de patientgrupper, der opfylder disse kriterier.

For bedre at kunne beskrive og sammenligne de bredere samfundsmæssige konsekvenser af mulige interventioner har Heller et al foreslået brug af begreberne disease impact number (DIN) og population impact number (PIN) [15].

Disease impact number

Denne defineres som:

og udtrykker antallet af patienter med den pågældende sygdom eller risikofaktor, blandt hvilke et udfald kan forebygges med den pågældende intervention.

Udtrykket er således analogt med NNT, NNH eller NNS, blot med den forskel at nævneren nu omfatter hele andelen af befolkningen med den pågældende tilstand eller risikofaktor, der reelt udsættes for interventionen. Det vil sige, at f.eks. patienter, der er døde før ankomsten til et sygehus, og patienter med kontraindikationer for den pågældende behandling inkluderes i nævneren.

Population impact number

Denne defineres som:

og beskriver antal personer i hele befolkningen, blandt hvem et udfald kan forebygges ved pågældende intervention.

Begreberne illustreres i Tabel 1 , hvor konsekvenserne af forskellige interventioner ved apoplexia cerebri er anført. Den beskedne absolutte gevinst ved lavdosis aspirin (RD: 3,1%) og apopleksienheder (RD: 5,0%) over for trombolyse (RD: 15,9%) opvejes på befolkningsniveau af, at langt den overvejende del af alle patienter kan tilbydes Aspirin og behandling på en apopleksienhed, hvorimod kun ganske få opfylder kriterierne for trombolyse, hvorfor DIN/PIN bliver væsentligt højere end for aspirinbehandling.

Hvis andelen af patienter, der reelt kan tilbydes behandlingen, er lille, f.eks. som følge af strenge in- og eksklusionskriterier, vil DIN blive væsentlig højere end NNT, NNH eller NNS, hvorimod de to tal vil ligge tæt på hinanden ved interventioner, der kan gives til stort set alle personer med den pågældende sygdom eller tilstand.

Som eksempel kan nævnes, at de meget lave NNT-værdier (< 10) for f.eks. trombolysebehandling af patienter med isk-æmisk apopleksi og carotis endarterektomi som sekundær profylakse mod nyt cerebralt infarkt [16, 17] kun er baseret på de få procent af patienterne, der opfyldte de meget strenge inklusionskriterier i de tilgrundliggende undersøgelser. Ved brug af DIN og PIN vil man bedre beskrive, hvorledes gevinsterne af de forskellige interventioner vil være, set i relation til den »almindelige« apopleksipatient, da nævneren i højere grad afspejler forholdene i hele baggrundspopulationen.

Betyder valg af risikomål noget
for implementering af forskningsresultater?

Det er gentagne gange dokumenteret, at undersøgelser, hvori der udelukkende præsenteres resultater i form af RR, bliver vurderet som mere effektive og pålidelige af både læger, patienter og sundhedsøkonomiske beslutningstagere end studier, hvori data præsenteres i form af reduktion af absolut risiko og NNT, NNH eller NNS [18, 19].

Præsentationsformen har altså en væsentlig betydning for, hvorledes effekten af givne interventioner tolkes, og formentlig derfor også for, med hvilken hastighed disse vinder indpas i daglig praksis.

Konklusion

Det er ikke muligt at summere alle aspekter af en eventuel behandlingseffekt i et enkelt tal.

Forfatterne bliver nødt til at anføre (og redaktørerne nødt til at efterspørge) de absolutte antal udfald i interventions- og kontrolgrupperne med angivelse af både AR, RR, RD og NNT, NNH eller NNS med angivelse af konfidensintervaller omkring de pågældende effektmål [20, 21]. Resultaterne kan f.eks. opstilles som anført i Tabel 2 . For patienter med en kronisk lidelse vil forlængelse af den sygdomsfri overlevelse formentlig være den lettest forståelige parameter.

Klinikeren kan herefter stille sig selv bl.a. følgende spørgsmål for at afgøre, om den kliniske praksis skal ændres på baggrund af den/de pågældende undersøgelse(r) [22]:

Er artiklen valid, blev randomisering gennemført korrekt, blev data analyseret efter intention-to-treat-princippet, og hvor komplet var opfølgningen?
Kan behandlingen reelt tilbydes?
Er størrelsen af de anførte effektmål klinisk relevante?
Individuel vurdering: Hvor meget ligner mine patienter undersøgelsens patienter, hvor stor er mine patienters risiko ved indgangen i studiet, og hvorledes vil forholdet mellem gevinst og omkostning (risiko + økonomi) være hos mine patienter?

Gunnar Lauge Nielsen, Klinisk Epidemiologisk Afdeling, Aalborg Sygehus, Postboks 561, DK-9100 Aalborg.

E-mail: uxgln@aas.nja.dk

Antaget: 22. marts 2004

Interessekonflikt: Ingen angivet

Scandinavian Simvastatin Survival Study Group (4-S). Lancet 1994;344: 1383-9.
Law MR, Wald NJ. Risk factor thresholds: their existence under scrutiny. BMJ 2002;324:1570-6.
Rose G. The strategy of preventive medicine. Oxford: Oxford University Press, 1995.
Kassai B, Gueyffier F, Boissel JP et al. Absolute benefit, number needed to treat and gain in life expectancy: which efficacy indices for measuring the treatment benefit. J Clin Epidemiol 2003;56:977-82.
Laupachis A, Sackett DL, Roberts RS. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med 1988;318:1728-33.
McQuay HJ, Moore RA. Using numerical results from systematic reviews in clinical practice. Ann Intern Med 1997;126:712-20.
Rembold CR. Number needed to screen: development of a statistic for dis-ease screening. BMJ 1998;317:307-12.
Kristiansen IS, Gyrd-Hansen D, Nexøe J et al. Number needed to treat: easily understood and intuitively meaningful? J Clin Epidemiol 2002;55:888-92.
Torp-Pedersen C, Køber L. Effect of ACE inhibitor trandolapril on life expect-ancy of patients with reduced left-ventrikular function after acute myocardial infarction (TRACE). Lancet 1999;354:9-12.
Lubsen J, Hoes A, Grobbee. Implications for trial results: the potential misleading notions of number needed to treat and average of duration of life gained. Lancet 2000;356:1757-9.
Payne C. BMJ, Web-letter, august 1998.
Tan LB, Murphy R. Shifts in mortality curves: saving or extending lives? Lancet 1999;354:1378-81.
Shepherd et al. Prevention of coronary heart disease with pravastatin in men with hyperchol

Summary

Summary How risk should be reported Ugeskr Læger 2005;167:375-379 The terms absolute risk, relative risk, risk difference and number needed to treat, harm or screen , which are often used in reporting risk at the individual level, are defined and illustrated with figures from the 4-S investigation. To assess the public health aspects of various interventions, the term etiologic fraction is defined and illustrated by means of data from WOSCOPS. Additionally, the terms disease impact number and population impact number are defined and illustrated through the effects of various interventions on the outcomes in patients with stroke. A table comprising the most relevant measures of risk is suggested.

Referencer

Scandinavian Simvastatin Survival Study Group (4-S). Lancet 1994;344: 1383-9.
Law MR, Wald NJ. Risk factor thresholds: their existence under scrutiny. BMJ 2002;324:1570-6.
Rose G. The strategy of preventive medicine. Oxford: Oxford University Press, 1995.
Kassai B, Gueyffier F, Boissel JP et al. Absolute benefit, number needed to treat and gain in life expectancy: which efficacy indices for measuring the treatment benefit. J Clin Epidemiol 2003;56:977-82.
Laupachis A, Sackett DL, Roberts RS. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med 1988;318:1728-33.
McQuay HJ, Moore RA. Using numerical results from systematic reviews in clinical practice. Ann Intern Med 1997;126:712-20.
Rembold CR. Number needed to screen: development of a statistic for dis-ease screening. BMJ 1998;317:307-12.
Kristiansen IS, Gyrd-Hansen D, Nexøe J et al. Number needed to treat: easily understood and intuitively meaningful? J Clin Epidemiol 2002;55:888-92.
Torp-Pedersen C, Køber L. Effect of ACE inhibitor trandolapril on life expect-ancy of patients with reduced left-ventrikular function after acute myocardial infarction (TRACE). Lancet 1999;354:9-12.
Lubsen J, Hoes A, Grobbee. Implications for trial results: the potential misleading notions of number needed to treat and average of duration of life gained. Lancet 2000;356:1757-9.
Payne C. BMJ, Web-letter, august 1998.
Tan LB, Murphy R. Shifts in mortality curves: saving or extending lives? Lancet 1999;354:1378-81.
Shepherd et al. Prevention of coronary heart disease with pravastatin in men with hypercholesterolaemia (WOSCOPS). N Eng J Med 1995;333:1301-7.
Eur Heart J Supplements, vol. 3 (suppl H) July 2001.
Heller R, Dobson A. Disease impact number and population impact number: population perspectives to measures of risk and benefit. BMJ 2000:321: 950-2.
Tissue plasminogen activator for acute ischemic stroke (NINDS). N Engl J Med 1995;333:1581-7.
Barnett HJ, Taylor DW, Eliasziw M et al. Benefit of carotid endarterectomy in patients with symptomatic moderate or severe stenosis (NASCET). N Engl J Med 1998;339:1415-2.
Fahey T. Evidence based purchasing: understanding results of clinical trials and systematic reviews. BMJ 1995;311:1056-9.
Nexø J, Gyrd-Hansen D, Kragstrup J et al. Danish GPs perception of disease risk and benefit of prevention. Family Practice 2002;19:3-6.
Guyatt GH, Cook DJ, Jaeschke R. How should clinicians use the results of randomized trial? ACP Journal Club 1995;122:A12.
Sackett DL, Haynes RB. Summarizing the effects of theraphy: a new table and some more terms. ACP Journal Club 1997;127:A15.
Glasziou P, Guyatt GH, Dans AL et al. Applying the results of trials and systematic reviews to individual patients. ACP Journal Club 1998;129:A15.