Hvad er effekten af placebobehandling?

Introduktion: Der er rapporteret klinisk betydende effekter af placebobehandlinger, men kvaliteten af evidensen er ikke blevet grundigt undersøgt.

Materiale og metoder: Vi udførte en systematisk oversigt over kliniske forsøg, hvor patienter var randomiseret til enten placebobehandling eller ingen behandling. En placebobehandling kunne være farmakologisk (fx en tablet), fysisk (fx en manipulation), eller psykisk (fx en neutral samtale).

Resultater: Vi fandt 130 forsøg, som opfyldte inklusionskriterierne. Efter eksklusion af 16 uden relevante data, var der 32 forsøg med binære effektmål og 82 forsøg med kontinuerte effektmål. Sammenlignet med ingen behandling havde placebobehandling ingen statistisk signifikant effekt på binære effektmål, relativ risiko 0,95 (95% sikkerhedsgrænser 0,88 til 1,02), uanset om effektmålene var subjektive eller objektive. For forsøg med kontinuerte effektmål var der en moderat forskel på placebobehandlede og ubehandlede patienter, standardiseret gennemsnitsdifferens -0,28 (-0,38 til -0,19), men effekten aftog med størrelsen af forsøget, hvilket tyder på bias. Den standardiserede gennemsnitsdifferens var statistisk signifikant for forsøg med subjektive effektmål -0,36 (-0,47 til -0,25), men ikke for forsøg med objektive effektmål -0,12 (-0,27 til 0,03). I forsøg af placebobehandlingers effekt på smerte blev der rapporteret en moderat, statistisk signifikant effekt, -0,27 (-0,40 til -0,15), men bias, fx rapporteringsbias, kunne ikke udelukkes.

Diskussion: Vi fandt ingen sikker evidens for, at placebobehandlinger generelt har klinisk betydende effekter.

Det rapporteres ofte, at placebobehandlinger forbedrer både subjektive og objektive effektmål hos omkring 30-40% af patienter ved en lang række kliniske tilstande, fx smerte, asthma, forhøjet blodtryk og akut myokardieinfarkt (1-3).

Langt størsteparten af artikler om placebo, inklusive de arbejder, der er henvist til ovenfor, har imidlertid vurderet effekten af placebobehandling som forbedring fra udgangsniveauet i placebogruppen i et kontrolleret forsøg, uden at placebogruppen sammenlignes med en ubehandlet kontrolgruppe. Dermed kan effekten af placebo ikke adskilles fra en sygdoms spontane remission, regression mod gennemsnittet eller andre ukendte faktorer (4-6). De rapporterede høje effekter af placebo kunne derfor, i hvert fald delvis, være udtryk for en fejlagtig forskningsmetode. På trods af disse forskningsmetodologiske problemer, og etiske overvejelser (7), er placebobehandlinger blevet anbefalet i artikler og ledere i førende tidsskrifter (3, 8, 9).

Vort primære formål var at undersøge, om placebobehandlinger har en klinisk betydende effekt. Sekundært ønskede vi at undersøge, om der var forskel på objektive og subjektive effektmål samt at undersøge effekten på specifikke kliniske tilstande. Vi gennemførte derfor en systematisk oversigt over kliniske forsøg, hvor patienterne var randomiseret til placebobehandling eller ingen behandling.

Materiale og metoder

Definition

Placebo er vanskeligt at definere tilfredsstillende (5). I kliniske forsøg er placebo ofte kontrolbehandlinger, der udadtil fremstår som den eksperimentelle behandling, men uden dennes essentielle komponenter. Vi definerede en placebobehandling pragmatisk som en behandling, der var blevet benævnt placebo i en rapport om et klinisk forsøg.

Litteratursøgning

Vi søgte i MEDLINE, EMBASE, PsycLIT, Biological Abstracts og Cochrane Controlled Trials Register for forsøg publiceret før 1999. Søgestrategien blev udviklet iterativt, baseret på synonymer for »placebo«, »randomiseret klinisk forsøg« og »ubehandlet« (10). Vi gennemgik referencelisterne systematisk i de inkluderede forsøg, udvalgte bøger og oversigtsartikler samt kontaktede placeboforskere for relevante forsøg.

Udvælgelse af forsøg

Vi inkluderede forsøg, hvor patienter blev tilfældigt fordelt til placebo og ingen behandling (ofte var der også en tredje »aktivt« behandlet gruppe). Vi ekskluderede forsøg, hvor det var klart, at randomiseringen ikke var forgået skjult - dvs. at det kunne forudsiges, i hvilken gruppe en patient ville havne, fx ved randomisering efter ugedag (11). Vi ekskluderede også forsøg, hvor deltagerne var raske eller modtog betaling, hvor objektive effektmål klart blev vurderet af en ublindet observatør, samt hvor patientfrafaldet var over 50%. Forsøg blev også ekskluderet, hvis det var indlysende, at den såkaldte placebobehandling havde en effekt, som ikke kun kunne henregnes til behandlingsritualet, fx instruktion i bevægeteknikker ved postoperativ smerte.

Ekstraktion af data

Som effektmål udvalgte vi det kliniske forsøgs primære objektive eller subjektive effektmål (helst et karakteristisk symptom). Hvis forsøgsrapporten ikke beskrev primære effektmål udvalgte vi det effektmål, vi vurderede som det klinisk mest relevante. Binære effektmål (fx ryger eller ikkeryger) blev foretrukket frem for kontinuerte effektmål (fx gennemsnitligt antal cigaretter). Resultater indsamlet umiddelbart efter behandlingsstop blev foretrukket frem for data indsamlet ved opfølgning. Begge forfattere udvalgte effektmål individuelt, og evt. uenighed blev klaret ved diskussion.

Datasyntese

For hvert klinisk forsøg med binære data udregnede vi den relative risiko, defineret som forholdet mellem syge patienter og alle patienter i placebogruppen, divideret med det samme forhold i kontrolgruppen. En relativ risiko på under en tyder på en positiv effekt af placebo.

For hvert klinisk forsøg med kontinuerte effektmål udregnede vi den standardiserede gennemsnitlige differens, defineret som differensen mellem gennemsnittet i placebogruppen og kontrolgruppen, divideret med den kombinerede standardafvigelse (12). En værdi på -1 betyder, at gennemsnittet i placebogruppen er en standardafvigelse lavere end gennemsnittet i kontrolgruppen, hvilket tyder på en positiv effekt af placebo.

Dernæst beregnede vi den samlede relative risiko for forsøg med binære effektmål, og den samlede standardiserede gennemsnitlige differens for forsøg med kontinuerte effektmål. På grund af forskelle, bl.a. i patientpopulationer og kliniske tilstande, forventede vi, at begge datasæt ville være heterogene (dvs. at de enkel te forsøgs effekt ville variere mere end forventet ved tilfældighed alene), og udførte derfor random effects -beregninger (13). Vi beregnede også det samlede resultat for objektive og subjektive effektmål, samt for alle kliniske tilstande undersøgt i mindst tre uafhængige forsøg (14).

Vi foretog en række planlagte subgruppeanalyser, for at se om vore resultater var følsomme over for karakteren af placebobehandlingen, type af effektmål samt forskelle i primærforsøgenes metodologiske kvalitet. Vi afsatte også effekten i hvert forsøg mod den reciprokke standardfejl (som øges med antallet af forsøgsdeltagere). Variationen i den estimerede effekt mindskes ved øget deltagerantal, så det forventelige udseende af et sådant diagram er en symmetrisk tragt (funnel) . Markant asymmetri i sådanne funnel plots skyldes ofte, at små forsøg rapporterer større effekter end store forsøg, fx på grund af publikationsbias eller andre former for bias (15).

Heterogenicitet blev undersøgt ved chi2 -test (13, 16). Alle resultater er anført med 95% sikkerhedsintervaller; alle p-værdier er dobbeltsidige.

Resultater

Forsøgene

Vi fandt 727 potentielle forsøg, heraf 404 som ikke var kliniske eller randomiserede; 129 undersøgelser som manglede en placebogruppe eller en ubehandlet gruppe; 29 tilfælde af dobbeltpublikation samt 11 forsøg med objektive effektmål, hvor det var klart, at disse blev vurderet ublindet. I 24 tilfælde blev forsøg ekskluderet af andre grunde, fx frafald større end 50%. Af de inkluderede 130 forsøg var det ikke muligt at ekstrahere data fra 16, hvorfor analysen baseres på 114 randomiserede forsøg. En liste over de inkluderede forsøg er tidligere publiceret (17).

Forsøgene var publiceret fra 1946 til 1998 på fem sprog. Der var 32 kliniske forsøg med binære effektmål med i alt 3.795 placebobehandlede og ubehandlede patienter. Der var 82 kliniske forsøg med kontinuerte effektmål med 4.730 patienter. Den typiske farmakologiske placebobehandling var en tablet med fyldstof, den typiske fysiske placebobehandling var en procedure med en maskine, som ikke var tændt, og den typiske psykologiske placebobehandling var en neutral ikke-styrende samtale mellem læge og behandler, ofte kaldet opmærksomhedsplacebo.

Der indgik 40 kliniske tilstande: hypertension, asthma, anæmi, hyperglykæmi, hyperkolesterolæmi, transportsyge, Raynauds sygdom, alkoholafhængighedssyndrom, tobaksrygning, overvægt, dårlig mundhygiejne, Herpes simplex, bakterielle infektioner, forkølelse, smerte, kvalme, ileus, infertilitet, manglende cervikal dilatation, fødsel, menopause, prostatisme, depression, skizofreni, søvnløshed, angst, fobi, kompulsiv neglebidning, mentalt handikap, dysfungerende parforhold, tandbehandlingsrelateret stress, manglende evne til orgasme, fækal inkontinens, enuresis, epilepsi, Parkinsons sygdom, Alzheimers sygdom, hyperaktivitet, karpaltunnelsyndrom og udiagnosticerede symptomer.

Binære effektmål

Placebobehandling havde ingen statistisk signifikant effekt på binære effektmål, samlet relativ risiko 0,95 (95% sikkerhedsinterval 0,88 til 1,02). Den samlede relative riskiko for forsøg med subjektive effektmål var 0,95 (0,86 til 1,05), og for forsøg med objektive effektmål 0,91 (Tabel 1 ) (0,80 til 1,04).

Der var statistisk signifikant heterogenicitet (p=0,003), men denne skyldtes ikke, at små forsøg viste større effekter end store forsøg (p=0,56) (15) (Fig. 1 ).

Tre kliniske problemer var blevet undersøgt i mindst tre uafhængige forsøg: kvalme, tilbagefald efter rygestop samt depression. Placebobehandlinger havde ingen statistisk signifikant effekt på nogen af tilstandene, men sikkerhedsgrænserne var brede (Tabel 2 ).

Kontinuerte effektmål

Der var en statistisk signifikant forskel, standardiseret gennemsnitlig differens -0,28 (-0,38 til -0,19). Det betyder, at intensiteten af symptomer, eller graderingen af uønskede objektive fund, i gennemsnit lå ca. en fjerdedel standardafvi- gelse lavere i placebogruppen. Den samlede standardiserede gennemsnitlige differens for forsøg med subjektive effektmål var også statistisk signifikant, -0,36 (-0,47 til -0,25), mens dette ikke var tilfældet for forsøg med objektive effektmål, -0,12 (-0,27 til 0,03) (Tabel 1).

Der var statistisk signifikant heterogenicitet (p<0,001). Størrelsen af effekten af placebo mindskedes med størrelsen af de enkelte forsøg (p=0,05) (Fig. 2 ).

Tre eller flere uafhængige forsøg undersøgte effekten af placebobehandling på smerte, overvægt, asthma, hypertension, søvnløshed og angst. Kun forsøg af smerte viste en statistisk signifikant effekt, standardiseret gennemsnitlig differens -0,27 (-0,40 til -0,15). Effekten svarer til en reduktion af smerteintensitet på 6,5 mm på en 100 mm visuel analog skala. Sikkerhedsgrænserne for estimatet på effekten af placebobehandlinger på de øvrige kliniske tilstande var brede (Tabel 2).

Vi fandt ingen statistisk signifikant forskel mellem forskellige typer af placebobehandling (Tabel 3 ). Vi kunne ikke påvise nogen statistisk signifikant forskel mellem kliniske forsøg med stort eller lille frafald; eller mellem kliniske forsøg hvor placebobehandling var en tillægsbehandling, og forsøg hvor placebobehandling var den eneste behandling (data ikke vist). Vi kunne heller ikke påvise nogen statistisk signifikant forskel mellem forsøg, hvor effekten af placebo var et eksplicit forskningsformål, og forsøg hvor det ikke var tilfældet; samt mellem forsøg hvor lægerne vidste, at behandlingen de gav, var placebo, og forsøg hvor lægerne var blindede mht. placebo og aktiv behandling (data ikke vist). Vi kan ikke afvise, at visse subgruppeanalyser ikke havde nok statistisk styrke til at påvise en forskel.

Diskussion

Vi fandt ingen statistisk signifikant effekt af placebobehandlinger på binære objektive eller binære subjektive effektmål, eller på kontinuerte objektive effektmål. Der var en beskeden, men statistisk signifikant, forskel i rapporteret effekt mellem placebobehandlede og ubehandlede patienter i forsøg med kontinuerte subjektive effektmål, især smerte.

Vore resultater kan være påvirket af flere forskellige typer af bias. Blindet evaluering af subjektive effektmål er ikke muligt i de kliniske forsøg, vi undersøgte. Patienter, som får placebo, kan tro, at de får en behandling, mens patienter i den ubehandlede gruppe ved, at de ikke får en behandling, hvilket kunne påvirke deres måde at rapportere symptomer på. Den manglende effekt af placebo på objektive effektmål tyder på, at raporteringsbias kunne have haft haft en betydning.

Hvis patienterne i de ubehandlede grupper oftere søgte anden behandling uden for forsøgets regi end patienterne i placebogruppen, ville en effekt af placebo kunne undervurderes. Få forsøg rapporterede dette forhold. Risikoen må antages at være større i forsøg, hvor placebo var den eneste behandling, og ikke givet som supplement til standardbehandling, men vi var ikke i stand til at finde en forskel i effekten af placebo mellem de to typer forsøg.

Effekten i små forsøg var større end effekten i store forsøg. Dette kunne skyldes, at små forsøg med negative effekter ikke var blevet publiceret eller var vanskelige at finde. Vor søgning var detaljeret, og vi fandt 114 forsøg, hvor en tidligere oversigt kun havde fundet 12 (18). Dårlig metodologisk kvalitet kunne også forklare vores resultat. Det overraskede os, at vi ikke kunne finde en sammenhæng mellem metodologisk kvalitet og rapporteret effekt af placebo, men den statistiske styrke af vore undergruppeanalyser kan have været for lav. Endelig kunne de højere effekter i små forsøg skyldes, at disse undersøgte kliniske tilstande, hvor der var en reel effekt af placebo, og store forsøg undersøgte tilstande uden en effekt. Under alle omstændigheder gør effektforskellen mellem store og små kliniske forsøg med kontinuerte effektmål, at disse resultater skal fortolkes forsigtigt.

Det kan være vanskeligt at vurdere, om en effekt rapporteret som standardiseret gennemsnitlig differens er stor nok til at være klinisk meningsfuld. Hvis vi ser bort fra de mulige typer af bias diskuteret ovenfor, udgør den samlede effekt af placebobehandling på smerte ca. en tredjedel af effekten af non-steroide anti-inflammatoriske præparater på ledsmerter (19). Det er usikkert om en effekt af denne størrelse er betydningsfuld for patienterne.

Resultaterne fra de inkluderede kliniske forsøg er heterogene, hvorfor de samlede beregninger af effekten af placebobehandling bør fortolkes som en forholdsvis grov samlet vurdering. Vi udførte adskillige prædefinerede undergruppeanalyser, for at se om vort resultat afhang af type af placebo, sygdom og effektmål. Vi var imidlertid ikke i stand til at identificere en undergruppe af forsøg med rimelig sikker betydende effekt af placebobehandling. Alligevel kan vi ikke afvise muligheden af, at en sådan gruppe er blevet overset ved, at vi har samlet resultater fra heterogene kliniske undersøgelser. Vore konklusioner er også begrænset til de kliniske tilstande og effektmål vi har undersøgt. Det er værd at bemærke, at få forsøg undersøgte effekten af placebo på meget brede effektmål, fx livskvalitet.

Vi undersøgte effekten af placebobehandlinger, og ikke effekten af læge-patient-forholdet mere bredt. Givet vore resultater virker det usandsynligt, at den særlige dynamik i læge-patient-forholdet, som er associeret til placebobehandling (eller det terapeutiske ritual), har en generel og væsentlig terapeutisk effekt. Men det udelukker ikke en mulig markant effekt af andre aspekter ved læge-patient-forholdet, for eksempel effekten af god information, god kontakt eller en positiv konsultationsstrategi (20). Det er interessant, i hvor høj grad en evt. effekt af andre aspekter af læge-patient-forholdet skyldes en mere præcis diagnosticering og bedre komplians med behandling (21).

Placebo bliver anvendt i blindede undersøgelser for at undgå flere forskellige former for bias, ikke bare for at kontrollere for effekten af placebo. Patienter, som ved, hvilken forsøgsgruppe de tilhører, kan adskille sig fra andre patienter i deres måde at rapportere effekt og bivirkninger på, i deres tilbøjelighed til at søge anden behandling og i deres risiko for at forlade forsøget. Desuden vil behandlere, som kender patientens gruppetilhørsforhold, kunne give disse en supplerende behandling og pleje, som adskiller sig fra andre patienters. Derudover vil ublindede behandlere muligvis vurdere objektive effektmål forskelligt, afhængigt af deres viden om patienters gruppetilhørsforhold. Derfor må man forvente en vis forskel mellem placebo og ubehandlede patienter i mange randomiserede forsøg, selv om man antager, at der ikke er nogen effekt af placebobehandling.

Vi var ikke i stand til at påvise forskelle i kliniske forsøg, som havde binære eller kontinuerte objektive effektmål. Dette overraskende resultat skyldes muligvis vores selektion af forsøg. Vort formål var at undersøge effekten af placebobehandling, hvorfor vi reducerede risikoen for observatørbias ved at ekskludere forsøg, hvor objektive effektmål klart blev vurderet af en ublindet observatør. Risikoen for bias relateret til patientfrafald blev tilsvarende reduceret ved, at vi primært analyserede data indsamlet lige efter afslutningen af behandlingen, og ikke opfølgningsdata. Desuden kan vi have underestimeret den bias, der er relateret til forskernes interesse, idet formålet med de fleste randomiserede forsøg, vi inkluderede, var at undersøge effekten af en »aktiv« behandling, og ikke effekten af placebo. Vor oversigt var ikke designet til at undersøge, om manglende dobbeltblinding er associeret med bias, hvorfor vore resultater ikke betyder, at placebokontrolgrupper kan erstattes af ubehandlede kontrolgrupper i randomiserede kliniske forsøg uden risiko for bias.

Konklusion

Vi fandt en moderat effekt af placebobehandlinger på subjektive kontinuerte effektmål og smerte, men bias kan ikke udelukkes. Vi fandt ingen effekt af placebobehandlinger på binære eller objektive effektmål. Vi fandt ingen sikker evidens for, at placebobehandlinger generelt har betydende kliniske effekter.

Asbjørn Hróbjartsson , Afdeling for Medicinsk Videskabsteori, Københavns Universitet, Panum Instituttet, DK-2200 København N.

E-mail: a.hrobjartsson@cochrane.dk

Antaget den 26. november 2001.

Københavns Universitet, Afdeling for Medicinsk Videnskabsteori, og

H:S Rigshospitalet, Det Nordiske Cochrane Center.

This article is based on a study first published in The New England Journal of Medicine 2001; 344: 1594-602.

Litteratur

Beecher HK. The powerful placebo. JAMA 1955; 159: 1602-6.
Lasagna L. The placebo effect. J Allergy Clin Immunol 1986; 78: 161-4.
Brown WA. The placebo effect. Sci Am 1998; 278: 68-3.
Kienle GS, Kiene H. The powerful placebo effect: fact or fiction? J Clin Epidemiol 1997; 50: 1311-8.
Gøtzsche PC. Is there logic in the placebo? Lancet 1994; 344: 925-6.
H

Hvad er effekten af placebobehandling?

Hvad er effekten af placebobehandling?

Summary

Referencer