I Rud, Matzen & Hildens oversigtsartikel med titlen »Mål for diagnostiske tests ydeevne« i Ugeskrift for Læger [1] gennemgås forskellige mål for diagnostiske tests træfsikkerhed. For-fatterne gør endvidere opmærksom på, at »... klinikere kan have svært ved at fortolke og anvende den information, der beskriver ydeevnen af en test«.
Det skyldes, at der er mange, der forveksler sensitiviteten (nosografisk sand positiv rate) af en test med den prædiktive værdi af en positiv test. Det vil sige, at man forveksler to spørgsmål: »Hvad er sandsynligheden for, at testen er positiv, hvis jeg har sygdommen?« og »Hvor stor er sandsynligheden for, at jeg har sygdommen, hvis testen er positiv?«.
Selvom man har disse begreber på det rene, opstår der alligevel ofte problemer.
Fakultetsmedlemmer, lægestab og studenter på Harvard Medical School blev bedt om at beregne sandsynligheden for sygdom ud fra følgende forudsætninger [2]: Den diagnostiske test har en falsk positiv rate på 5%, og sygdommen har en prævalens på 1/1.000. Hvad er sandsynligheden for, at en person, der har en positiv test, har sygdommen, givet det er de eneste informationer, der foreligger? Svarene varierede fra 95% (angivet af 27 ud af 60 deltagere) til 2% (angivet af 11 ud af 60 deltagere). Som patient må man føle sig foruroliget over forskellen på den medicinske vurdering. Det korrekte svar er, at det afhænger af testens sensitivitet. Ingen gav dette svar, som i øvrigt ikke var angivet. Hvis man går ud fra, at testen fanger alle de syge, dvs. at testen har en sensitivitet på 100%, vil svaret være 2 (1,96)%. Da prævalensen er lav, spiller sensitiviteten næsten ingen rolle. Afgørende er risikoen for falsk, positive test (1-specificiteten).
Bayes' formel anvendes til beregning af sensitivitet og specificitet, men er svær at håndtere, når f.eks. en kvinde, der lige har fået at vide, at mammografien er positiv, spørger lægen om, hvor stor risikoen er for, at hun har brystkræft.
Hvis man anvender betingede sandsynligheder, ser Bayes' formel sådan ud: Se Figur 1 .
Det turde være indlysende, at anvendelse af frekvenser og fordelingstræer er lettere for de fleste at anvende, når patienter spørger lægen, hvor urolige de bør være, når undersøgelsen viser sig at være positiv.
Referencer
- Rud B, Matzen P, Hilden J. Mål for diagnostiske tests ydeevne. Ugeskr Læger 2005;167:3018-22.
- Hoffrage U, Lindsey S, Hertwig R et al. Communicating statistical information. Science 2000;290:2261-2.
- Gigerenzer G. Calculated risks. New York: Simon & Shuster, 2002.