Introduktion: Formålet med studiet var dels at undersøge, hvilket evidensniveau der var anført for den diagnostiske træfsikkerhed af anbefalede klinisk-biokemiske undersøgelser, dels at opgøre den generelle anvendelse af referencer i klaringsrapporterne i årene 1996-2001.
Materiale og metoder: Hver af de 54 klaringsrapporter, som omhandlede en klassisk klinisk problemstilling, blev gennemgået for at finde anbefalinger om diagnostisk anvendelse af klinisk-biokemiske undersøgelser. Det anførte evidensniveau for den diagnostiske træfsikkerhed af disse undersøgelser blev bedømt ud fra et internationalt anerkendt evidenshierarki. Desuden blev det noteret, om man i klaringsrapporterne angav referencer, om der i så fald var henvisninger hertil i teksten, og om princippet med angivelse af den evidensbaserede styrke af anbefalinger blev anvendt.
Resultater: I 20 klaringsrapporter fandtes i alt 36 anbefalinger om diagnostisk anvendelse af biokemiske undersøgelser. For tre fjerdedele af disse anbefalinger var der anført det lavest mulige evidensniveau med hensyn til den diagnostiske træfsikkerhed. Opgørelsen af den generelle anvendelse af referencer viste, at man i fem ud af de 54 klaringsrapporter slet ikke anførte referencer, og at man kun i 34 bragte henvisninger til litteraturlisten i direkte relation til udsagn i teksten. Princippet med at angive den evidensbaserede styrke af anbefalinger blev anvendt i fem af klaringsrapporterne.
Diskussion: Internationalt er der stor opmærksomhed på behovet for at sikre, at diagnostiske procedurer anvendes på et solidt evidensgrundlag. Klaringsrapporterne må betragtes som væsentlige nationale kliniske vejledninger, og denne undersøgelse bekræfter, at der er et dokumentationsproblem for klinisk-biokemiske undersøgelser. Den generelle anvendelse af referencer tyder dog på, at det anførte evidensniveau også kan være utilstrækkeligt for andre typer af anbefalinger.
Både lokalt, nationalt og internationalt lægges der stor vægt på gode kliniske vejledninger, der kan sikre en ensartet og rationel patientbehandling. Desværre er kvaliteten af mange kliniske vejledninger ikke tilfredsstillende [1-4]. Det er vigtigt, at anbefalinger i sådanne vejledninger hviler på et solidt og gennemskueligt evidensgrundlag. Det bør fremgå, hvordan den anvendte litteratur er blevet udvalgt, og centrale anbefalinger bør være ledsaget af en entydig kildeangivelse, gerne med angivelse af evidensniveauet bag eller styrken af anbefalingen [5]. Mens man i dag har velkendte og gode værktøjer til at sikre et godt evidensniveau for anbefalinger om behandlinger, er forholdene vanskeligere, når det drejer sig om diagnostiske procedurer såsom klinisk-biokemiske undersøgelser [6-9].
Siden 1996 har mange lægevidenskabelige selskaber fået udarbejdet en række klaringsrapporter, der må betragtes som vigtige nationale kliniske vejledninger. Hovedformålet med denne undersøgelse er at belyse, hvilket evidensniveau der er anført for den diagnostiske træfsikkerhed af de klinisk-biokemiske undersøgelser, som man i klaringsrapporterne anbefaler anvendt i diagnostikken. Ved diagnostisk træfsikkerhed forstås undersøgelsens evne til at adskille patienter med og uden en given sygdom. Den belyses bedst ved at sammenligne resultaterne af den pågældende undersøgelse med resultaterne af en eksisterende diagnostisk guldstandard [10]. Under gennemgangen af klaringsrapporterne registrerede vi desuden den generelle brug af referencer, og i hvilken udstrækning man i rapporterne anvendte princippet med at anføre styrken af de givne anbefalinger.
Materiale og metoder
I perioden 1996-2001 blev der udsendt 60 klaringsrapporter. Følgende seks, som skønnedes ikke at være en gennemgang af en klassisk klinisk problemstilling, blev ekskluderet: Den gode medicinske afdeling, Klinisk genetik et nyt tværgående speciale, Kvalitetssikring på arbejdsmedicinske afdelinger, Overvågning og forbedring af lægefaglige kerneydelser, Audit - en metode til kvalitetsudvikling i klinisk praksis samt Den højt specialiserede enhed i det danske sygehusvæsen. Hver af de resterende 54 klaringsrapporter blev gennemgået af denne artikels forfattere i grupper på to. Der blev opnået konsensus om at vurdere følgende forhold:
-
Indeholdt klaringsrapporten en graderet angivelse af evidensniveauet eller styrken bag anbefalingerne?
-
Blev der anvendt referencer i klaringsrapporten? Hvis ja, var der så litteraturhenvisninger i teksten, så man uden videre kunne se, hvilke referencer de enkelte udsagn var baseret på?
-
Indeholdt klaringsrapporten egentlige anbefalinger vedrørende diagnostisk anvendelse af specifikke biokemiske undersøgelser i forbindelse med udredning af den sygdom, som klaringsrapporten handler om? Biokemiske undersøgelser, som selv er den diagnostiske guldstandard (f.eks. fastende glukose til diagnostik af diabetes, kolesterol samt triglycerider ved dyslipidæmi og koronarenzymer ved akut myokardieinfarkt), blev ikke medtaget. Anbefalinger vedrørende diagnostik af sygdomme, som var perifere i forhold til klaringsrapportens hovedemne, blev heller ikke medtaget. Vurdering af, om en given undersøgelse skulle betragtes som en klinisk biokemisk undersøgelse, skete efter konsensus i forfattergruppen.
-
For hver anbefaling blev både de biokemiske undersøgelser og det diagnostiske formål registreret. Endvidere blev det noteret, hvorvidt anbefalingen var støttet af en eller flere referencer. I klaringsrapporter uden direkte litteraturhenvisninger i teksten blev det vurderet, om nogen af litteraturlistens referencer oplagt måtte formodes at støtte anbefalingen.
For hver anbefaling vedrørende diagnostisk anvendelse af klinisk biokemiske undersøgelser blev de ovenfor anførte referencer gennemgået af en af denne artikels forfattere for at fastlægge det anførte evidensniveau for den diagnostiske træfsikkerhed af den anbefalede undersøgelse. Evidensniveauet blev fastlagt ud fra et evidenshierarki, der er let modificeret i forhold til Sackett et al's [10] (Tabel 1 ). Dette evidenshierarki er valgt, fordi det er specifikt rettet mod studier af diagnostiske undersøgelsers diagnostiske træfsikkerhed. Niveau 1 er det højeste/bedste evidensniveau, mens niveau 5 er det laveste/dårligste. I de tilfælde, hvor der ikke var anført nogen referencer, blev anbefalingen betragtet som niveau 5 (ekspertvurdering uden anført evidens). I de tilfælde, hvor der var opgivet referencer, blev evidensniveauet fastlagt ud fra disses metodologiske design. Hvis referencen var en almindelig oversigtsartikel eller en anden klinisk vejledning, blev relevante artikler blandt dennes referencer fremskaffet. Hvis oversigtsartiklen eller den kliniske vejledning udelukkende refererede til andre ikkeoriginalartikler blev evidensniveauet sat som niveau 5. Anbefalinger, som omfattede flere biokemiske undersøgelser, blev tildelt evidensniveauet svarende til den undersøgelse, der havde det højeste niveau.
Resultater
Anbefalinger om diagnostisk anvendelse af klinisk-biokemiske undersøgelser
Tyve (37%) af klaringsrapporterne indeholdt anbefalinger vedrørende diagnostisk anvendelse af specifikke klinisk-biokemiske undersøgelser. De 20 klaringsrapporter indeholdt i alt 36 sådanne anbefalinger. Disse 36 anbefalinger, og de anførte evidensniveauer for den diagnostiske træfsikkerhed er anført i Tabel 2 . To af anbefalingerne hvilede på evidensniveau 1, tre på niveau 2, en på niveau 3, to på niveau 4 og 28 på niveau 5. Således var det anførte evidensniveau det lavest mulige for 78% af anbefalingerne.
Generel brug af referencer og angivelse af evidensniveau i de 54 klaringsrapporter
I fem klaringsrapporter (9%) var der ingen referencer, og i 15 (28%) var der en litteraturliste, men ingen litteraturhenvisninger i direkte tilslutning til udsagnene i teksten. De sidste 34 klaringsrapporter (63%) havde en litteraturliste, hvortil der blev henvist i teksten. I fem klaringsrapporter (9%) anvendte man princippet med at angive evidensniveauet eller styrken af anbefalinger i relation til de givne anbefalinger.
Diskussion
I dette studie undersøgte vi, hvilket evidensniveau der var anført for den diagnostiske træfsikkerhed af de klinisk-biokemiske undersøgelser, som i klaringsrapporterne 1996-2001 blev anbefalet anvendt. For tre fjerdedele af anbefalingerne var der anført det lavest mulige evidensniveau, »ekspertvurdering uden anført evidens«. Da vi kun medtog undersøgelserne inden for klaringsrapporternes hovedemner, og da anbefalinger, der omfattede flere biokemiske undersøgelser fik et evidensniveau svarende til den med det højeste niveau, vil dette studie tendere til at overvurdere det anførte evidensniveau bag anbefalingerne om diagnostisk anvendelse af klinisk-biokemiske undersøgelser. Det lave anførte evidensniveau bag disse anbefalinger betyder ikke, at anbefalingerne er forkerte, men det svækker den vægt, læseren kan tillægge dem. Årsagen til det lave anførte evidensniveau er formentlig både utilstrækkelig opmærksomhed på betydningen af at anføre et solidt evidensniveau bag diagnostisk anvendelse af klinisk-biokemiske undersøgelser, og at mange af de eksisterende origi-nalartikler om emnet er af dårlig kvalitet [7, 9, 11].
I forbindelse med den »kliniske nytteværdi« af en diagnostisk undersøgelse kan man både interessere sig for den diagnostiske træfsikkerhed og for den pågældende undersøgelses direkte konsekvenser for patienten (outcome ) [12]. Outcome belyses bedst ved randomiserede kontrollerede undersøgelser, om end der kan være behov for designmæssige justeringer i forbindelse med diagnostiske undersøgelser [13]. I dette studie har vi fokuseret på diagnostisk træfsikkerhed, fordi det er det aspekt af diagnostiske undersøgelser, der oftest bliver beskrevet i litteraturen. Desuden er der netop nu betydelig fokus på behovet for at forbedre kvaliteten af sådanne artikler. I 2000 blev der nedsat en arbejdsgruppe kaldet Standards for Reporting of Diagnostic Accuracy (STARD), der består af en række tidsskriftsredaktører samt epidemiologer og laboratorielæger [12]. Formålet med STARD-gruppens arbejde er at skabe konsensus for, hvordan studier af diagnostiske undersøgelsers diagnostiske træfsikkerhed bør gennemføres og afrapporteres. STARD-gruppens første anbefalinger med checklister og forslag til flowdiagrammer er netop blevet publiceret [13-16]. Checklisten omfatter en detaljeret beskrivelse af den kliniske problemstilling, af patientpopulationen og af de analysetekniske forhold omkring den diagnostiske undersøgelse. For klinisk-biokemiske undersøgelser vil dette kun kunne opnås ved studier, der gennemføres i et tæt samarbejde mellem det klinisk-biokemiske og andre kliniske specialer.
Der er en stærkere tradition for at sikre et godt evidensgrundlag for behandlingsmæssige end for diagnostiske procedurer. I en ny dansk undersøgelse fandt man, at omkring halvdelen af de behandlingsmæssige interventioner er baseret på randomiserede kontrollerede forsøg [17]. At anvendelsen af referencer i knap 40% af klaringsrapporterne var af en sådan karakter, at det var vanskeligt eller umuligt at finde relevante referencer for specifikke udsagn, tyder dog på, at det anførte evidensgrundlag også kan være utilstrækkeligt for andre ikkediagnostiske anbefalinger.
Summary
The Danish clinical guidelines (»Klaringsrapporter«), 1996-2001: insufficient evidence presented for the diagnostic accuracy of recommended biochemical tests
Ugeskr Læger 2004;166:1667-1670
Introduction: Our aim was to investigate the level of evidence presented for the diagnostic accuracy of biochemical tests re-commended for diagnostic use in the Danish clinical guidelines (»Kla-ringsrapporter«) in 1996-2001. We also appraised the use of references in the guidelines.
Materials and methods: We examined 54 guidelines in order to make recommendations regarding the diagnostic use of biochemical tests. We then rated the level of evidence presented for the accuracy of diagnosis using an internationally recognized evidence hierarchy. We also noted whether the guidelines presented a list of references and whether it was possible to link statements to specific references. Finally, we examined whether the principle of presenting the reliability of recommendations was applied in the guidelines.
Results: Twenty of the guidelines presented 36 recommendations for the diagnostic use of biochemical tests. The level of evidence presented for the tests' diagnostic accuracy was the lowest possible for three fourths of the 36 recommendations. With regard to the general use of references, 5 of the 54 guidelines did not present any references, and references were linked directly with the recommendations in only 34 of the 49 guidelines that provided a list of references. Five of the guidelines applied the principle of presenting the reliability of the recommendations.
Discussion: Internationally, there is growing concern about the need to ensure an evidence-based use of diagnostic proced-ures. This study of Danish guidelines confirms that such a problem exists in relati on to biochemical tests. However, the general use of references in the guidelines indicates that the level of evidence presented is likely to be insufficient for other recommendations as well.
Per E. Jørgensen, Afdeling KKA, Odense Universitetshospital, DK-5000 Odense C. E-mail: per.jorgensen@ouh.fyns-amt.dk
Antaget: 9. januar 2004
Interessekonflikter: Ingen angivet
*) Dansk Selskab for Klinisk Biokemis arbejdsgruppe til fremme af evidensbaseret anvendelse af klinisk biokemi.
Summary
Summary The Danish clinical guidelines (»Klaringsrapporter«), 1996-2001: insufficient evidence presented for the diagnostic accuracy of recommended biochemical tests Ugeskr Læger 2004;166:1667-1670 Introduction: Our aim was to investigate the level of evidence presented for the diagnostic accuracy of biochemical tests re-commended for diagnostic use in the Danish clinical guidelines (»Kla-ringsrapporter«) in 1996-2001. We also appraised the use of references in the guidelines. Materials and methods: We examined 54 guidelines in order to make recommendations regarding the diagnostic use of biochemical tests. We then rated the level of evidence presented for the accuracy of diagnosis using an internationally recognized evidence hierarchy. We also noted whether the guidelines presented a list of references and whether it was possible to link statements to specific references. Finally, we examined whether the principle of presenting the reliability of recommendations was applied in the guidelines. Results: Twenty of the guidelines presented 36 recommendations for the diagnostic use of biochemical tests. The level of evidence presented for the tests' diagnostic accuracy was the lowest possible for three fourths of the 36 recommendations. With regard to the general use of references, 5 of the 54 guidelines did not present any references, and references were linked directly with the recommendations in only 34 of the 49 guidelines that provided a list of references. Five of the guidelines applied the principle of presenting the reliability of the recommendations. Discussion: Internationally, there is growing concern about the need to ensure an evidence-based use of diagnostic proced-ures. This study of Danish guidelines confirms that such a problem exists in relation to biochemical tests. However, the general use of references in the guidelines indicates that the level of evidence presented is likely to be insufficient for other recommendations as well.
Referencer
- Shaneyfelt TM, Mayo-Smith MF, Rothwangl J. Are Guidelines following guidelines? - the methodological quality of clinical practice guidelines in the peer-reviewed medical literature. JAMA 1999;281:1900-5.
- Varonen H, Mäkelä M. Practice guidelines in Finland: availability and quality. Qual Health Care 1997;6:75-9.
- Grilli R, Magrini N, Penna A et al. Practice guidelines developed by speciality societies: the need for a critical appraisal. Lancet 2000;355:103-6.
- Miller J, Petrie J. Development of practice guidelines. Lancet 2000;355:82-3.
- Habour R, Miller J. A new system for grading recommendations in evidence based guidelines. BMJ 2001;323:334-6.
- Jørgensen PE, Madsen JS, Larsen TB et al. Evidensbaseret anvendelse af klinisk biokemi. Ugeskr Læger 2001;163:5815-9.
- Lijmer JG, Mol BW, Heisterkamp S et al. Emperical evidence of design-related bias in studies of diagnostic tests JAMA 1999;282:1061-6.
- Price CP. Evidence-based laboratory medicine: supporting decision making. Clin Chem 2000;46:1041-50.
- Oosterhuis WP, Niessen RWLM, Bossuyt PMM. The science of systematic reviewing studies of diagnostic tests. Clin Chem Lab Med 2000;38:577-88.
- Sackett DL, Straus SE, Richardson WS et al. Evidence-based Medicine - how to practice and teach EBM. 2nd edition. Edinburgh: Churcill Livingstone, 2000.
- Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research - getting better but still not good. JAMA 1995;274:645-51.
- Magid E, Jørgensen PE, Jørgensen LGM et al. Diagnostik: nye metodologiske initiativer. Ugeskr Læger 2004;166:1664-6.
- Bossuyt PMM, Lijmer JG, Mol BWJ. Randomised comparisons of medical tests: sometimes invalid, not always efficient. Lancet 2000;356:1844-7.
- Bossuyt PM, Reitsma JB for the STARD group. The STARD initiative. Lancet 2003;361:71.
- Bossuyt PMM, Reitsma JB, Bruns DE et al. STARD group. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Ann Int Med 2003;138:40-4.
- Bossuyt PMM, Reitsma JB, Bruns DE et al. The STARD statement for report-ing studies of diagnostic accuracy: explanation and elaboration. Ann Int Med 2003;138:W1-W12.
- Matzen P. Hvor evidensbaseret er medicinen? Ugeskr Læger 2003;165: 1431-5.