Indledning: Statistik og god talforståelse er vigtige faglige redskaber for læger i forhold til forståelse og kommunikation af risikoestimater.
Materiale og metode: I denne spørgeskemaundersøgelse blandt 129 speciallægekursister undersøgtes evnen til at udregne og sammenligne risikoværdier, som relativ risiko-reduktion, absolut risiko-reduktion, number needed to treat og en kombination af disse, samt den generelle talforståelse i forhold til sandsynligheder.
Resultater: I undersøgelsen blev det påvist, at 69% af deltagerne var i stand til at beregne en risikoreduktion korrekt. Respondenternes svar afhang ikke af, om informationen var givet som en absolut eller relativ risiko-reduktion. 13% af deltagerne kunne korrekt estimere risikoen for et falsk positivt svar ved en screening.
Konklusion: De yngre læger udviste en overraskende ringe evne til basal sandsynlighedsregning og forståelse af screeningsresultater. God forståelse af risikomål og basale sandsynligheder er en forudsætning for reel objektiv patientinformation. Denne undersøgelse indikerer, at der er plads til betydelige forbedringer på disse om-råder.
I hverdagen bruger læger statistik og matematik. De skal fortolke testresultater, udregne medicindoser samt læse og formidle lægefaglige informationer til bl.a. kollegaer og patienter. Statistik og god talforståelse er vigtige faglige redskaber og bruges for eksempel til at forklare en cancerpatient virkningen af kemoterapi, så patienten informeres om sandsynligheden for overlevelse og risiko for bivirkninger, eller patienten, der skal opereres, bliver informeret om risikoen ved indgrebet og sandsynligheden for at få det bedre eller blive helbredt. Det er velkendt, at formatet af anvendte risikoreduktionsmål har stor betydning for beslutningsprocessen vedrørende intervention mod risikofaktorer [1-4], ligesom der er eksempler på, at både læger og patienter fejlvurderer risiko og mulig risikoreduktion [5-7] eller i det mindste vurderer en given risiko meget forskelligt [8]. Disse vanskeligheder kan bl.a. skyldes dårlig kommunikation eller mangelfuld viden om basal statistik og sandsynlighedsregning. I dette studie undersøgte vi evnen til at udregne og sammenligne forskellige mål for risikoreduktion: relativ risiko-reduktion (RRR), absolut risiko reduktion (ARR) og number needed to treat (NNT) blandt yngre læger på speciallægekursus. For at undersøge lægernes generelle forståelse af basal statistik, sandsynlighedsregning og deres erfaring med disse emner, indeholdt det anvendte spørgeskema også mere generelle spørgsmål om talforståelse og sandsynligheder.
Metode
Til undersøgelsen anvendtes et til lejligheden designet spørgeskema, som var baseret på et spørgeskema anvendt i en amerikansk undersøgelse af medicinstuderende [9]. Den danske version af spørgeskemaet blev forud for anvendelse pilottestet blandt 20 danske medicinstuderende.
Dataindsamling
Efter aftale med kursusansvarlige læger blev spørgeskemaet afleveret personligt til 133 læger, der deltog i obligatoriske kurser i speciallægeuddannelsen. Kun fire personer valgte ikke at deltage i undersøgelsen. Den ene af forfatterne (LSY) var til stede, mens lægerne besvarede spørgeskemaer. Der var dermed mulighed for at besvare spørgsmål af teknisk art og observere, om den enkelte læge besvarede spørgeskemaet selvstændigt. Med baggrund i det gennemførte pilotstudie var der afsat 15 minutter til besvarelsen.
Spørgeskemaet
Spørgeskemaet var inddelt i tre dele. I første del blev de yngre læger spurgt, om de tidligere havde arbejdet med statistik/ epidemiologi eller havde interesseret sig for lotto, kortspil m.m. for at se, om nogle respondenter havde særlige forudsætninger.
Anden del var identisk med den amerikanske undersøgelse (Figur 1 ). De yngre læger randomiseredes til fire grupper og skulle besvare en caseopgave på baggrund af forskellig information om risikoreduktion (Figur 1). Den første gruppe fik informationer om mulig risikoreduktion udtrykt med anvendelse af en kombination (KOMB) af alle tre risikoreduktionsmål (RRR, ARR og NNT). Den anden gruppe fik informationer udtrykt som RRR, den tredje gruppe udtrykt som ARR og den fjerde gruppe udtrykt som NNT (Figur 1). To hypotetiske medicinske behandlinger skulle sammenlignes med angivelse af, hvilken der var mest effektiv (»A er mere effektiv end B«, »B er mere effektiv end A«, »A og B er lige effektive« eller »ved ikke«), hvorefter risikoen for at få sygdommen trods behandling skulle udregnes og angives numerisk. Endelig blev de yngre læger bedt om at udvælge den bedste beskrivelse af risikoen for at få sygdommen trods behandling med anvendelse af termerne: »meget sandsynligt«, »sandsynligt«, »usandsynligt« og »meget usandsynligt«.
Tredje del af spørgeskemaet bestod af syv opgaver. De syv opgaver blev stillet for at vurdere deltagernes matematiske færdigheder. Der var tre svarmuligheder og kun et korrekt svar til hver opgave.
Statistisk analyse
Undersøgelsen blev oprindeligt planlagt for at sammenligne yngre læger under uddannelse til speciallæger i almen medicin, intern medicin og kirurgi. Ved styrkeberegning med anvendelse af standarddeviation beregnet på baggrund af pilotstudie , α = 0,05, 1-β = 80% kan en forskel på 20% detekteres med 50 deltagere i hver gruppe. Studiet blev følgende planlagt med deltagelse af 150 respondenter fordelt med 50 fra speciallægekursus i almen medicin, 50 fra speciallægekursus i intern medicin og 50 fra speciallægekursus i kirurgi. Det var imidlertid sværere end forventet at få tilladelse til at dele spørgeskemaer ud på de forskellige speciallægekurser, da flere kursusledere angav ikke at kunne afsætte tid til undersøgelsen. Fordelingen af respondenter var følgende: 93 fra speciallægekursus i almen medicin, ti fra speciallægekursus i arbejdsmedicin og 26 fra speciallægekursus i ortopædkirurgi, 129 i alt (51% mænd). Sammenligning mellem uddannelsessøgende fra de forskell ige specialer har derfor måttet opgives.
Der blev brugt χ2 -test til at sammenligne data med. Ved mindre end fem observationer på subgrupperne blev resultatet kontrolleret vha. Fishers eksakte test. Der blev foretaget parvis sammenligning mellem de fire versioner, der er angivet i Figur 1.
Resultater
I gennemsnit kunne 88% korrekt angive, hvilken behandling der var mest effektiv. Ved parvis sammenligning af gruppen, der fik risikoreduktionsinformationen som kombination af parametrene ARR, RRR og NNT (KOMB), med grupperne, der kun fik information vha. en parameter, fandtes ingen signifikant forskel (p-værdier på 0,25-0,76).
Risikoreduktionen kunne korrekt udregnes af 69% af del-tagerne. Besvarelsen var uafhængig af, om informationen var givet i form af RRR (75% korrekte svar), ARR (62,5%), NNT (68,8%) eller alle risikoreduktionsmål i kombination (69,7%) (p-værdier på 0,63-0,75).
Hverken køn, specialebaggrund eller tidligere erfaring med sandsynlighedsregning/statistik havde indflydelse på opgavebesvarelserne.
Blandt deltagerne svarede 85% på seks eller syv opgaver relateret til matematiske færdigheder. For flertallet af opgaverne var under 40% af respondenterne i stand til at afgive korrekt svar (Tabel 1 ). Ved udregning af de syv opgaver i spørgeskemaets tredje del svarede 52% af lægerne rigtigt på to opgaver eller derunder. I opgave syv (Tabel 2 ), der omhandler mammografiscreening, var 13% af respondenterne i stand til korrekt at vurdere størrelsen af risikoen for et falsk positiv screeningssvar (Tabel 1).
Diskussion
Lægerne havde generelt en meget lille forståelse for basal statistik og var ikke i stand til at anvende basale epidemiologiske og statistiske begreber på en klinisk situation, som endda forud for undersøgelsen var blevet debatteret bredt både i lægevidenskabelige tidsskrifter og i den danske dagspresse. De adspurgte læger var alle under speciallægeuddannelse. De repræsenterede et bredt udsnit af yngre danske læger og adskilte sig ikke fra gennemsnittet af uddannelsessøgende yngre læger med hensyn til alder eller køn.
Ved forespørgsel om tilladelse fra kursusledere til fremmøde på kurserne blev vores undersøgelse beskrevet som en spørgeskemaundersøgelse af 15 minutters varighed. Under-søgelsen kostede altså et beskedent tidsforbrug og krævede ingen arbejdsindsats fra kursuslederen. Undersøgelsen blev ikke beskrevet i detaljer på forhånd for kursuslederen. Kun fire uddannelsessøgende læger svarende til 3% afviste at deltage i undersøgelsen. Undersøgelsens resultat vurderes derfor ikke at have været påvirket af betydende selektionsbias. Undersøgelse af forskelle mellem de forskellige specialer måtte som anført i metodeafsnit opgives.
Resultater af vores undersøgelse viste, at flertallet af de undersøgte yngre læger var i stand til at sammenligne effekten af to forskellige »behandlinger« uafhængigt af formatet for risikoreduktionen. I modsætning til dette fund er det tidligere fundet, at danske praktiserende læger er meget påvirkelige af formatet for risikoreduktion, således at de er mere tilbøjelige til at anbefale en behandling, når gevinst i risikoreduktion angives som RRR frem for ARR eller NNT [2, 10].
I en amerikansk undersøgelse af en gruppe førsteårsmedicinstuderendes talforståelse og deres evne til at udregne risikoreduktion [9] fandt man, at studerende med en dårligere talforståelse også havde sværere ved at forstå og anvende medicinske data. I den amerikanske undersøgelse var de medicinstuderende signifikant dårligere til at udregne NNT (25%) end til at udregne RRR og ARR (75%). I vores undersøgelse svarede 68,8% af de yngre læger, der fik caseopgaven i form af NNT, korrekt på beregningsopgaven, hvilket er markant bedre end de amerikanske medicinstuderende. Derudover klarede de danske læger sig på niveau med de amerikanske medicinstuderende.
De matematiske opgaver, undtagen opgave syv, blev fundet i bøger, der svarer til gymnasialt grundniveau. Den kliniske opgave syv var relevant og aktuel i forhold til den igangværende debat i dags- og fagpresse. Det var overraskende, at 52% af lægerne kun svarede rigtigt på to opgaver eller derunder. Dette er et dårligere resultat, end en talgenerator for tilfældigt tal ville opnå. Det dårlige resultat skyldes ikke, at lægerne ikke svarede. Hovedparten af de yngre læger svarede på alle syv matematiske opgaver, men flertallet svarede imidlertid forkert. Ikkebesvarede spørgsmål indgik i analysen som manglende. Dette medfører bias i retning af mere optimistisk vurdering af undersøgelsespopulationens statistiske færdigheder, idet de, der ikke svarede, formentlig undlod at svare, fordi de ikke kendte svaret. Dårligst resultat blev opnået i opgave syv vedrørende den kliniske problemstilling omkring mammografiscreening. Kun 13% var i stand til at vurdere risikoen for falsk positiv screeningssvar korrekt. Det er overraskende få, idet forståelse af problematikken med falsk positive og falsk negative fund ved screeningsundersøgelser er kernestof og nødvendig baggrund for relevant faglig forståelse såvel som patientkommunikation [11].
Opgave syv var den eneste opgave, der var relateret til en klinisk problemstilling. Situationen burde være velkendt fra den kliniske hverdag og fra debatten i dagspressen. Det er derfor overraskende, at lægerne klarede denne opgave særlig dårligt. Opgaven var den sidste i opgavesættet, og en årsag kunne være, at deltagerne ikke havde tid nok. På baggrund af observation af lægerne under udfyldelsen af spørgeskemaerne, vurderes det næppe at være den eneste årsag.
Man kan derfor med god ret spørge, om de yngre læger fagligt er klædt på til at informere om screening, og om de forstår værdien af information om falsk positive og falsk negative fund. Hvis de ikke forstår termerne falsk positivt og falsk negativt resultat, vanskeliggør det reel objektiv patientinformation.
God forståelse af risikoreduktionsmål og forståelse af basal sandsynlighedsregning er væsentlige forudsætninger for reel objektiv patientinformation. Denne undersøgelse indikerer, at der er plads til betydelige forbedringer på disse områder.
Summary
Communicating risk - a matter of chance?
Ugeskr Læger 2007;169(24):2325-2328
Introduction: Statistics and a good understanding of numbers are important professional tools for doctors in order to understand and communicate risk estimates.
Materials and methods: In this questionnaire survey carried out among 129 specialist trainees the ability to calculate and compare risk values (Relative Risk Reduction, Absolute Risk Reduction, Number Needed to Treat and a combination of these) was examined along with the general understanding of numbers in relation to probabilities.
Results: The survey showed that 69% of the participants were able to calculate a risk reduction accurately. Answers from the respondents did not depend on whether information was given as absolute or relative risk reductions. 13% of the participants were able to correctly estimate the risk of a false positive answer in connection with screening.
Conclusion: The trainee doctors demonstrated a surprisingly poor ability to make basic probability calculations and a poor understanding of screening results. A thorough understanding of risk m easures as well as basic probabilities is a prerequisite for good objective patient information. This survey indicates that there is considerable room for improvement in these areas.
Jesper Bo Nielsen , Institut for Sundhedstjenesteforskning, Miljømedicin, Syddansk Universitet, JB Winsløwparken 17, DK-5000 Odense C. E-mail: jbnielsen@health.sdu.dk
Antaget: 24. november 2006
Interessekonflikter: Ingen angivet
Summary
Summary Communicating risk - a matter of chance? Ugeskr Læger 2007;169(24):2325-2328 Introduction: Statistics and a good understanding of numbers are important professional tools for doctors in order to understand and communicate risk estimates. Materials and methods: In this questionnaire survey carried out among 129 specialist trainees the ability to calculate and compare risk values (Relative Risk Reduction, Absolute Risk Reduction, Number Needed to Treat and a combination of these) was examined along with the general understanding of numbers in relation to probabilities. Results: The survey showed that 69% of the participants were able to calculate a risk reduction accurately. Answers from the respondents did not depend on whether information was given as absolute or relative risk reductions. 13% of the participants were able to correctly estimate the risk of a false positive answer in connection with screening. Conclusion: The trainee doctors demonstrated a surprisingly poor ability to make basic probability calculations and a poor understanding of screening results. A thorough understanding of risk measures as well as basic probabilities is a prerequisite for good objective patient information. This survey indicates that there is considerable room for improvement in these areas.
Referencer
- Bobbio M, Demichelis B, Giustetto G. Completeness of reporting trial results: effect on physicians' willingness to prescribe. Lancet 1994;343:1209-1.
- Cranney M, Walley T. Same information, different decisions: the influence of evidence on the management of hypertension in the elderly. Br J Gen Pract 1996;46:661-3.
- Hux JE, Naylor CD. Communicating the benefits of chronic preventive ther-apy: does the format of efficacy data determine patients' acceptance of treatment? Med Decis Making 1995;15:152-7.
- Misselbrook D, Armstrong D. Patients' responses to risk information about the benefits of treating hypertension. Br J Gen Pract 2001;51:276-9.
- Reventlow S, Hvas AC, Tulinius C. "In really great danger ..." The concept of risk in general practice. Scand J Prim Health Care 2001;19:71-5.
- Kristiansen IS, Nexøe J, Gyrd-Hansen D et al. NNT is not easily understood. Fam Pract 2002;19:566.
- Nexøe J, Kristiansen IS. Number needed to treat - en statistisk kasuisitik. Ugeskr Læger 2002;164:351.
- Steel N. Thresholds for taking antihypertensive drugs in different professional and lay groups: questionnaire survey. BMJ 2000;320:1446-7.
- Sheridan SL, Pignone M. Numeracy and the medical student's ability to interpret data. Eff Clin Pract 2002;5:35-40.
- Nexøe J, Gyrd-Hansen D, Kragstrup J et al. Danish general practitioners' perception of disease risk and benefit of prevention. Fam Pract 2002;19:3-6.
- Brodersen J. Measuring psychosocial consequences of false-positive screen-ing results - breast cancer as an example. Københavns Universitet, Sundhedsvidenskabeligt Fakultet, 2006.