Hvor evidensbaseret er medicinen?

Introduktion: I begyndelsen af 1990'erne mente man, at kun 10-15% af medicinske interventioner skete på baggrund af randomiserede kontrollerede forsøg. For at undersøge i hvilken grad kliniske interventioner ved behandling af den enkelte patient er evidensbaserede, blev der gennemført et systematisk review af publicerede empiriske undersøgelser på området.

Materiale og metoder: Ved litteratursøgning på MEDLINE 1995-2002 blev der fundet 15 publicerede arbejder, hvor der er taget udgangspunkt i konkrete patientforløb, og hvor den enkelte intervention er evalueret, således at den har kunnet klassificeres som byggende på randomiserede kontrollerede forsøg eller ej. Arbejderne blev læst kritisk for at uddrage antallet af patienter og interventioner, samt hvilken klinisk videnskabelig metode der har ligget til grund for interventionerne, herunder om deres effekt er vist i randomiserede kontrollerede forsøg.

Resultater: Inden for intern medicin synes over 50% af interventionerne at bygge på randomiserede kontrollerede forsøg, mens dette tal er noget lavere inden for almen medicin, kirurgi, anæstesiologi og dermatologi. Psykiatri er i en meget lille undersøgelse topscorer med 65% af interventionerne på baggrund af randomiserede kontrollerede forsøg, hvorfor flere undersøgelser, som evt. kan bekræfte dette, efterlyses.

Diskussion: Det tilrådes, at der gennemføres undersøgelser over evidensen for kliniske interventioner, helst med assistance fra kolleger uden for specialet. Der bør være tilstrækkelig adgang til litteraturdatabaser og til sekundær litteratur på området. Man bør sikre, at indikationen for en evt. intervention er belyst i randomiserede, kontrollerede forsøg ved sammenligning med observation uden behandling eller placebobehandling. Endelig er det ønskeligt, at forfatterne ville anvende et ensartet klassifikationssystem til evaluering af den litteratur, der danner basis for interventionerne. Det konkluderes, at der er behov for denne form for løbende audit for at sikre, at den behandling, der tilbydes patienterne, er i overensstemmelse med den bedste evidens.

Gennem 1990'erne var det en ofte citeret, men slet dokumenteret vandrehistorie, at kun 10-15% af de medicinske interventioner var baseret på solid videnskabelig dokumentation (1). Begrebet evidensbaseret medicin var samtidig blevet introduceret som et paradigmeskift i klinisk medicin (2) og er af sine grundlæggere blevet defineret som »systematisk og afvejet brug af den bedste foreliggende evidens fra den kliniske forskning vedrørende håndteringen af den enkelte patients problemer« (3). Paradigmeskiftet bestod i, at klinikeren i stedet for især at basere sin patientbehandling på ekspertudsagn formulerer patientens kliniske problem, søger relevant litteratur, som læses kritisk, for at uddrage en løsning på problemet og iværksætter denne i samarbejde med patienten. I løbet af anden halvdel af 1990'erne har man på grund af den nævnte vandrehistorie på en række afdelinger og i en række specialer gennemført en vurdering af, i hvilket omfang interventioner inden for det givne speciale byggede på evidens fra klinisk videnskabelig forskning.

Formålet med nærværende arbejde var at gennemføre et systematisk review af publicerede empiriske undersøgelser over, i hvilken grad kliniske interventioner ved behandling af den enkelte patient er evidensbaserede.

Metode
Litteratursøgning og - udvælgelse

Der er i juli 2001 og atter i januar 2002 blevet søgt i MEDLINE via PubMed med følgende søgetermer: #1 »evidence based« (som også omfatter »Evidence based medicine« [MESH]); #2 »randomi* controlled trials« (som også omfatter »Randomised controlled trials« [MESH]); #3 »intervention*«; #4 »decision«; #5 »practice«. Resultaterne af #3, #4 og #5 er med OR sammenlagt til #6, hvorefter #1, #2 og #6 er kombineret med AND. Søgningen er begrænset til litteratur, der vedrører mennesker, har abstract og er publiceret efter 1994, da der intetsteds er fundet referencer til denne type undersøgelse, som er publiceret før 1995. Titler og abstract fra de fundne mere end 500 referencer er gennemgået af forfatteren, og artikler er udvalgt til kritisk læsning, hvis de opfyldte følgende kriterier: 1) tog udgangspunkt i konkrete patientforløb, dvs. at ikke alene behandlingsmodaliteter var evalueret, 2) evidensen for den enkelte intervention over for det enkelte kliniske problem var evalueret, og 3) evidensen for interventioner var klassificeret efter de tilgrundliggende studiers design. Som minimum om evidensen stammer fra randomiserede kontrollerede forsøg (RCT), eller om dette ikke var tilfældet.

På grundlag af abstract blev der udvalgt 17 artikler, hvoraf to viste sig at være parallelpublikationer, hvis først publicerede udgave blev valgt. Der var derfor 15 arbejder til kritisk læsning.

Kritisk litteraturlæsning

Under læsningen af de udvalgte referencers metodeafsnit blev følgende noteret: publikationsår, undersøgelsesperiode, undersøgelsessted, det kliniske speciale, om undersøgelsen blev gennemført prospektivt eller retrospektivt, hvorledes det kliniske problem og den tilsvarende intervention blev defineret, hvorledes der blev søgt og udvalgt evidens fra litteraturen vedrørende interventionen, og hvordan denne evidens blev klassificeret af arbejdets forfattere. Af resultatafsnittene i referencerne er uddraget antallet af patienter og interventioner (hvis disse var forskellige fra antallet af patienter), fordelingen af de interventioner, som bygger på evidens, og hvordan denne blev klassificeret af forfatterne. Der er i denne forbindelse lagt vægt på, om interventionen for det aktuelle problem var fundet effektiv i RCT, samt i hvilket omfang det blev angivet, om der fandtes evidens for virksomme interventioner, som ikke blev gennemført. Hvor det har været muligt, blev der skelnet mellem evidens fra randomiserede forsøg vedrørende indikationen for interventionen, altså om der forelå evidens for interventionen på baggrund af en kontrolgruppe, der ikke blev behandlet, eller hvor der blev anvendt placebo, og evidens for at interventioner er ligeværdige eller for at én aktiv intervention er bedre end en anden. Resultaterne af denne litteraturgennemgang er indført i et resuméark, som er anvendt som grundlag for det videre arb ejde med artiklerne, herunder udformning af tabeller.

Analyse

Det har pga. forskellighed i metode og validitet af de udvalgte referencer ikke været muligt at foretage en metaanalyse af de numeriske angivelser i materialerne. Det har derfor været nødvendigt at begrænse sig til et systematisk review med metodekritik, som er mundet ud i en verbalt formuleret syntese og forslag til, hvorledes eventuelle fremtidige studier af problemstillingen med fordel vil kunne udformes.

Resultater

Dataindsamlingen til de 15 fundne referencer blev foretaget fra 1995 til 1998, mens artiklerne er blevet publiceret i 1995-2001 (4 -18). Arbejdernes oprindelsessted og speciale fremgår af Tabel 1 . Seks af arbejderne er angivet at være gennemført prospektivt (5, 6, 9, 11, 13, 15), hvilket kun kan have været delvist muligt for det ene arbejdes vedkommende (5), mens de øvrige er retrospektive. Ni af arbejderne har alene undersøgt evidensen for én intervention over for de inkluderede patienters primære problem, mens de øvrige i større eller mindre omfang har medtaget interventioner over for flere problemer hos samme patient. Litteratursøgningen for at finde evidens for de forskellige interventioner har primært været via MEDLINE på Internettet eller på cd-rom, i fire tilfælde i The Cochrane Library og i andre tilfælde i diverse andre databaser. Der er anvendt forskellige klassifikationer af den foreliggende evidens, hvilket fremgår af Tabel 2 . Otte af arbejderne har brugt en klassifikation, som er anvendt i den første undersøgelse af Ellis & al (5) eventuelt med modifikationer (16). Det er muligt ud fra alle klassifikationer at afgøre, hvor stor en del af interventionerne, der bygger på evidens fra RCT herunder også på systematiske reviews eller metaanalyser, der er foretaget på grundlag af RCT. Det er derfor angivet i Tabel 1, hvor stor en del af interventionerne der er baseret på RCT. De anvendte klassifikationer i de forskellige arbejder er angivet i Tabel 2. I 14 af arbejderne er der med forskellige definitioner angivet en klasse af interventioner, som bygger på anden god evidens, hvor forfatterne af forskellige grunde, oftest etiske, ikke har fundet det rimeligt at forlange evidens fra RCT. Imidlertid varierer definitionerne af denne kategori fra ganske få »alt eller intet«-fænomener til almindelig konsensus om, hvad der er den bedste behandling, hvorfor der ikke kan foretages en meningsfuld sammenligning. Ved »alt eller intet«-fænomener forstås her behandling på grundlag af publicerede resultater, hvor »alle døde, før man fik behandlingen, men nu overlever nogen efter behandling« fx resuscitation ved hjertestop, eller »nogen døde, før man fik behandlingen, nu overlever alle, der behandles« fx insulinbehandling ved diabetisk koma. Kun i tre af arbejderne fremgår det, at der i 1-5% af tilfældene er anvendt behandling i strid med resultaterne af RCT, uden at det er forklaret, hvorfor dette er tilfældet (12, 16, 18). Ud fra to arbejder er det muligt at afgøre, i hvilke tilfælde indikationen for intervention bygger på en ubehandlet eller en placebobehandlet kontrolgruppe (12, 16), hvorimod det for flere arbejder fremgår, at RCT sammenligner forskellige interventioner, mens det ikke er anført, om indikationen for intervention er undersøgt i en RCT. Et eksempel herpå er laparoskopisk kolecystektomi for ukompliceret galdeblæresten, som angives at bygge på evidens fra RCT (9, 15, 18). Imidlertid er der litteraturhenvisning til RCT, der sammenligner laparoskopisk kolecystektomi med åben operation, mens der ikke er henvisning til RCT, hvor kolecystektomi er sammenlignet med observation uden operation. I de to britiske materialer om børnekirurgi er der ofte angivet evidens for indgreb, som bygger på resultater fra RCT gennemført på voksne (4, 11). Dette gælder fx for operation for gastroøsofageal refluks, som udgør 11 af de 18 operationer i materialet, der bygger på RCT (4). Relevansen af denne evidens kan derfor diskuteres.

Diskussion

Den vandrehistorie, som chokerede både patienter, klinikere, administratorer og sundhedspolitikere for mindre end ti år siden, at kun 10-15% af de interventioner, der udførtes på patienter i forskellige specialer, var baseret på solid videnskabelig dokumentation, må anses for at være manet i jorden. De mange RCT, der er udført gennem de seneste 50 år - i The Cochrane Controlled Trials Register er der i dag registreret 336.092 resuméer fra artikler, der er skrevet på grundlag af RCT - har naturligvis fået betydelig indflydelse på den behandling, der tilbydes patienterne. Mest konsistent ser dette ud til at være tilfældet i intern medicin (5, 12, 14, 17) og med hensyn til nye kirurgiske behandlingsmodaliteter såsom laparoskopisk kirurgi (15). Derimod fremgår det af Nordin-Johansson & Asplunds arbejde, at der er stor forskel på, i hvilken grad behandlingen inden for de intern medicinske subspecialer er baseret på RCT (14), specielt var der ingen af de nefrologiske interventioner i den svenske undersøgelse og kun få af de endokrinologiske og hæmatologiske, der var baseret på RCT, hvilket er i overensstemmelse med en britisk undersøgelse af hæmatologiske interventioner (6). Den lille undersøgelse, som viste at 65% af de psykiatriske interventioner var baseret på RCT, kan nok ikke lægges til grund for et generelt udsagn om, at psykiatrien overvejende er baseret på RCT (7). Dertil er de inkluderede 40 patientforløb for få. Man kunne ønske sig en langt mere omfattende undersøgelse inden for dette store speciale. De noget lavere rater for interventioner på grundlag af RCT i almen medicin og inden for kirurgi er næppe overraskende, når specialernes karakter tages i betragtning.

Hvorvidt det er mest hensigtsmæssigt, at en undersøgelse af, i hvilken grad en afdelings behandling bygger på foreliggende evidens, udføres prospektivt eller retrospektivt, er et åbent spørgsmål. Et af argumenterne for at foretrække retrospektive undersøgelser er ønsket om at undgå den såkaldte Hawthorne-effekt, hvorved forstås risikoen for, at klinikeren skulle ændre adfærd, fordi man ved, at adfærden bliver underkastet kritisk revision (10). I den første af de 13 undersøgelser af Ellis & al er det anført, at undersøgelsen er prospektiv, hvad den imidlertid ikke kan have været i hele undersøgelsesperioden, da den er planlagt i de to første dage af april 1995, mens den er gennemført i hele april måned 1995 (5). Det er denne forfatters opfattelse, at undersøgelser af denne art bedst udføres retrospektivt som en audit, hvad de gennemførte undersøgelser i realiteten ser ud til at være også i de tilfælde, hvor der er sket en prospektiv registrering af indgåede patienter. Der må dog advares mod mulig bias på grund af selektiv udvælgelse af patientindgang ved retrospektive audit.

Med hensyn til hvilke problemer og deraf følgende interventioner, der bør undersøges i forbindelse med hvert enkelt patientforløb, hersker der også mange meninger. I de fleste undersøgelser havde man udvalgt et hovedproblem per patient, mens andre registrerede flere interventioner per patient. Det er ikke afklaret, hvorledes man mest hensigtsmæssigt forholder sig hertil. Der er heller ikke taget stilling til, hvorledes man skal forholde sig til patienter, der ikke er tilbudt nogen intervention. I to af de fire undersøgelser over kirurgisk praksis har man ekskluderet patienter, der ikke blev opereret (4, 11), mens observation i to af studierne anføres som en intervention (9, 18). Det må efter denne forfatter s mening anses for rigtigt at opfatte observation eller konservativ behandling som en »passiv« intervention, som man i det enkelte tilfælde har valgt ud fra den foreliggende evidens. Denne problemstilling knytter sig nært til problemstillingen om, hvorvidt en »aktiv« intervention er indiceret. Det bør fremgå af RCT, om det kan forventes, at en aktiv intervention har en gavnlig effekt i forhold til ingen aktiv behandling. Herefter kan der tages stilling til, om den ene type af intervention er bedre end den anden, hvis der er flere muligheder. Dette er der ikke altid taget hensyn til i de fleste arbejder; i arbejdet fra Michaud et al er det dog anført (12).

Man må også spørge, om de arbejder, der anføres som evidensgrundlag, nu også er relevante for problemstillingen hos den aktuelle patient. Det er således påfaldende, at 11 af de 18 operationer, der er foretaget på grundlag af RCT, i en undersøgelse af børnekirurgi drejer sig om antirefluksoperationer, der begrundes med randomiserede undersøgelser udført på voksne patienter, ja endog på veteraner, med gastroøsofageal refluks (4). Der bør i sådanne tilfælde være taget eksplicit stilling til, om ekstrapolation fra resultaterne af RCT er acceptabelt, hvilket meget vel kan være tilfældet i en række kliniske situationer, hvor der praktiseres evidensbaseret medicin, men næppe i dette tilfælde (19).

Et gennemgående problem ved verifikation af evidensen er betinget af informationsteknologien i den periode, hvor undersøgelserne blev gennemført. Der forelå kun beskedne muligheder for verifikation i databaser over evalueret evidens, idet The Cochrane Database of Systematic Reviews, Best Evidence og Clinical Evidence enten ikke forelå, eller var langt mindre udbyggede end i dag (20). The Cochrane Library er således kun blevet anvendt i fire af de 15 arbejder (6, 13, 14, 18) og Best Evidence kun i et (18). Man har derfor oftest været henvist til at søge evidens via MEDLINE og oftest på cd-rom. Dette kan være såvel tidsrøvende som skuffende, da selv professionelle bibliotekarer ofte ikke finder den foreliggende evidens. I et enkelt tilfælde rådede man tilsyneladende kun over en cd-rom med de seneste fem års MEDLINE, hvorfor ældre RCT må være overset (16). I et tilfælde har man anvendt en personlig database over kritisk evalueret litteratur, altså evalueret evidens, som imidlertid også må antages at have dannet grundlag for en del af interventionerne på den undersøgte afdeling (5).

I flertallet af de gennemførte undersøgelser har man klassificeret evidensen i tre grader, som Ellis & al gjorde i den første undersøgelsesom I: evidens fra RCT, II: interventioner med overbevisende ikkeeksperimentel evidens og III: interventioner uden substantiel evidens (5). Især mellemgruppen er problematisk, idet den synes at være for rummelig, særlig når man som de fleste forfattere selv har været dommer over, hvorledes evidensen skulle fortolkes. Det er derfor langt mere hensigtsmæssigt at dele denne kategori op i ganske få indiskutable interventioner, såsom insulinbehandling til dårligt reguleret diabetes mellitus og de øvrige, hvor man har undersøgt, om der er almindelig konsensus om interventionen hos et antal eksterne specialister (14). Det ville være ønskeligt, at man anvendte en klassifikation af evidens, som den Ugeskriftet anvender for oversigtsarbejder. Denne klassifikation svarer til den, der er angivet af Eccles (21), som kan udvides til at omfatte observationelle studier og klassifikation af studier over diagnostiske test (22).

For at undgå de muligheder for bias, som er anført, det vil sige relevans- og ekstrapolationsproblemet, bias fordi egen evalueret evidens har dannet grundlag for såvel intervention som evaluering, bias fordi spørgsmålet om indikationen er uafklaret, evaluering af styrken af evidens fra ikkerandomiserede studier etc., foreslås det, at der foruden bedømmere fra egen afdeling også deltager eksterne bedømmere, som kan fungere som »Djævelens advokat«, og som bør have den endelige afgørelse i tvivlsspørgsmål.

Som konklusion på dette review må det anføres, at der er behov for løbende audit med hensyn til, om den behandling, man tilbyder, er i overensstemmelsen med den bedste evidens. Mange interventioner - og langt flere end de formodede 10 -15% - er især inden for visse specialer og subspecialer evidensbaserede. Der er dog fortsat et stort behov for RCT, men også for audit med henblik på om den kliniske videnskabs resultater kommer patienterne til gode.

Peter Matzen, Gastroenheden, Medicinsk Gastroenterologisk Afsnit 439, H:S Hvidovre Hospital, Kettegård Allé 30, DK-2650 Hvidovre.
E-mail: peter.matzen@hh.hosp.dk

Antaget den 20. september 2002.

H:S Hvidovre Hospital, Gastroenheden, Medicinsk Gastroenterologisk Afsnit 439.

Smith R. Where is the wisdom? BMJ 1991; 303: 798-9.
Evidence-Based Medicine Working Group. Evidence-based medicine. JAMA 1992; 268: 2420-5.
Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Evidence-b

Hvor evidensbaseret er medicinen?

Referencer