Skip to main content

Forbedret rapportering af skadevirkninger i randomiserede forsøg: udvidelse af CONSORT-vejledningen - Sekundærpublikation

Overlæge Peter C. Gøtzsche for CONSORT-gruppen

31. okt. 2005
7 min.


Der er omfattende evidens for, at rapporteringen af resultater af randomiserede forsøg er af dårlig kvalitet. For at rette op på dette henviser mange medicinske tidsskrifter til CONSORT-vejledningen (Consolidated Standards of Reporting Trials), som består af en checkliste med 22 punkter og et flowdiagram. Det er også veldokumenteret, at der er et påtrængende behov for at forbedre rapporteringen af skadevirkninger i randomiserede forsøg. Medlemmer af CONSORT-gruppen, inklusive tidsskriftsredaktører og forskere, mødtes i Canada i maj 2003 for at diskutere dette problem. Resultatet blev, at checklisten for CONSORT blev udvidet med ti anbefalinger om skadevirkninger med forklaringer og eksempler for at belyse specielle aspekter af god rapportering. Vi håber, at denne udvidelse af CONSORT-vejledningen kan hjælpe forfattere til at forbedre kvaliteten af rapportering af data om skadevirkninger fra randomiserede forsøg, så læserne bedre kan vurdere og fortolke sådanne data.Tidsskrifter kan også støtte formålet ved at henvise forfattere til det udvidede dokument i deres manuskriptvejledninger (www.consort-statement.org).

Reporting harms may cause more trouble and discredit than the fame and glory associated with successful reporting of benefits [1].

CONSORT-vejledningens formål er at standardisere og forbedre artikler om randomiserede forsøg. Den består af en checkliste og et flowdiagram [2], publiceret første gang i 1996. Medlemmer af CONSORT-gruppen, inklusive tidsskriftsredaktører og forskere, mødtes i Canada i maj 2003 for at diskutere den mangelfulde rapportering af skadevirkninger [3, 4]. Herefter blev checklisten udvidet med ti anbefalinger om skadevirkninger med forklaringer og eksempler [5].

Terminologien er ofte vildledende. I forsøgsregistret i Cochrane-biblioteket (nr. 3, 2003) gav søgetermen efficacy 55.374 referencer, safety 23.415, og harm OR harms kun 337, af hvilke mange var irrelevante artikler f.eks. om selvpåførte skadevirkninger. Safety er en beroligende term, som tilslører det faktum, at lægemidler og andre interventioner kan forårsage reelle - og potentielt alvorlige - skadevirkninger. Vi opfordrer derfor forfattere til at tale om harms i stedet for safety .

Nedenfor gives et resume af vore anbefalinger, som er publiceret andetsteds [5] og på vor hjemmeside (www.consort-statement.org). Vi opfordrer interesserede til at indsende forslag til forbedringer til hjemmesiden, og vi håber, at tidsskrifter, der henviser til CONSORT, vil støtte vort forsøg på at forbedre rapporteringen af skadevirkninger, f.eks. ved at citere anbefalingerne i manuskriptvejledningerne.

Titel og abstrakt

Hvis man i forsøget indsamlede data om skadelige og gavnlige virkninger, bør dette fremgå af titlen eller resumeet. Hvis der ikke var nogen vigtige skadevirkninger, bør dette noteres.

Baggrund

Hvis man i forsøget undersøger både skadelige og gavnlige virkninger, bør dette fremgå, og balancen mellem dem overvejes.

Effektmål

De undersøgte skadevirkninger, kliniske såvel som laboratoriemæssige, skal anføres med definitioner og graduering for hver af dem og en beskrivelse af, om data omfatter alle skadevirkninger eller et udvalg (i givet fald hvordan, hvorfor og hvem, der foretog udvælgelsen). Forfatterne bør gøre rede for, om måleinstrumenterne var standardiserede og validerede [6, 7] med referencer, og nye definitioner bør være eksplicitte og anvise, hvordan den foreslåede skala er udviklet og valideret.

Forfatterne bør gøre rede for, hvordan data blev indsamlet, inkl. måletidspunkter for monitorering og stopperegler for skadevirkninger, hvis det er relevant, samt hvordan man afgjorde, om skadevirkningerne var relateret til behandlingen. Når patienter stopper behandlingen før planlagt tid, bør det fremgå, hvem (patienter og/eller læger) der besluttede, hvad årsagen til ophøret var (f.eks. toksicitet, manglende effekt, andre årsager eller kombinationer af årsager) og hvordan (blindet eller ej).

Forsøg med nonsteroide, antiinflammatoriske stoffer (NSAIDs) viser, hvor vigtige metoderne kan være. Der blev rapporteret om over ti gange så mange mavesår i forsøg, hvor selektive NSAIDs med færre gastrointestinale skadevirkninger blev sammenlignet med gamle NSAIDs, end i forsøg, hvor gamle NSAIDs blev sammenlignet med placebo [8]. I de nyere forsøg blev patienterne udsat for regelmæssig endoskopi, og definitionen af mavesår savnede ofte klinisk relevans.

Statistiske metoder

Når skadevirkninger er vigtige effektmål, bør forfatterne beskrive planer for præsentation og formelle, statistiske analyser og tolkninger (inkl. kategorisering, håndtering af gentagne begivenheder, kontinuerte data og tidsaspektet) og gøre rede for, hvilke analyser der er præspecificerede, og hvilke der er post hoc-specificerede.

Når forskere kombinerer data for forskellige skadevirkninger, bør de angive, hvilke kombinationer de benytter, citere relevante referencer og gøre klart rede for, om de besluttede sig for samlingen (eller splittelsen) post hoc eller a priori.

For kontinuerte variabler, f.eks. mange laboratorieundersøgelser, kan gennemsnit og standardafvigelser eller medianer og interpercentile spændvidder give et samlet billede, men man kan overse ekstreme værdier, der svarer til alvorlig toksicitet.

Resultater

For hver behandlingsgruppe beskrives de frafald, der skyldes skadevirkninger, og erfaringen med behandlingen. Dødsfald anføres altid for hver behandlingsgruppe, uanset om død var et effektmål eller ej, og hvad man anser for at være årsagssammenhængen.

Nævneren for analyser af skadevirkninger skal opgives, især fordi terminologien er forvirrende, f.eks. intention-to-treat-, modified intention-to-treat- og on-treatment -analyser. Intention-to-treat må foretrækkes, idet den overholder randomiseringen.

Den absolutte risiko pr. behandlingsgruppe for hver type, grad og alvorlighed af skadevirkninger anføres, og resultatafsnittet bør svare til, hvad der loves i metodeafsnittet [9]. Fravigelse fra denne symmetri bør forklares. Hvis der ikke var nogen skadevirkninger af en given type og alvorlighedsgrad, bør dette nævnes.

Eventuelle subgruppeanalyser og eksploratoriske analyser beskrives, og forfatterne bør angive hvordan, hvorfor og hvornår de planlagde subgruppeanalyserne (a priori eller post hoc).

I Figur 1 vises almindelige eksempler på dårlig rapporteringspraksis, som bør undgås.

Diskussion

De r bør gives en afbalanceret diskussion af gavnlige og skadelige virkninger med henvisning til forsøgets begrænsninger, generaliserbarhed og andre kilder til information. Almindelige begrænsninger er kort eksponering, især ved kroniske sygdomme, og at forsøgsdeltagerne ofte er raske, bortset fra den sygdom, man er interesseret i, hvilket ikke afspejler den måde, de fleste behandlinger bruges på.

Overfortolkning af fundene må undgås, og forfatterne bør systematisk integrere anden viden om skadevirkninger, når det er muligt, f.eks. data fra spontan rapportering, databaser, case-kontrol-forsøg og kasuistikker [10]. Hvis der ikke findes en systematisk oversigt, bør dette nævnes, så der kan rettes op på denne mangel i fremtiden.

Længden af manuskriptet

Hvis en rapport om skadevirkninger publiceres separat i et andet manuskript, fortabes muligheden for at vurdere balancen mellem gavnlige og skadelige virkninger. Forfattere bør rapportere begge virkninger i samme manuskript og overveje at publicere yderligere data på tidsskriftets hjemmeside. Diskussionen er det dårligst strukturerede afsnit i artikler og kan forkortes for at få plads til passende rapportering af skadevirkninger.



Korrespondance: Peter Gøtzsche , Det Nordiske Cochrane Center, afsnit 7112, H:S Rigshospitalet, DK-2100 København Ø.
E-mail: pcg@cochrane.dk

Antaget: 22. november 2004

Interessekonflikter: Ingen angivet

Taksigelse: Jeg takker de øvrige forfattere til originalartiklen i Annals of Internal Medicine: John P.A. Ioannidis , MD, Stephen J.W. Evans , MSc, Robert T. O'Neill , PhD, Douglas G. Altman , DSc, Kenneth Schulz , PhD og David Moher , PhD.


Fondsstøtte: Abbott Laboratories, Children's Hospital of Eastern Ontario Research Institute, Health Canada, The Lancet og Merck and Co., Inc., sponsorerede arbejdsmødet. Douglas G Altman støttes af Cancer Research UK. Laurence Hirsch , MD, og Beate Stych , MD, (Merck) deltog i mødet som observatører.

This article is based on a study first reported in the Annals of Internal Medicine 2004;141:781-8.



Referencer

  1. Cuervo LG, Clarke M. Balancing benefits and harms in health care: we need to get better evidence about harms. BMJ 2003;327:65-6.
  2. Altman DG, Schulz KF, Moher D et al for the CONSORT GROUP (Consolidated Standards of Reporting Trials). The revised CONSORT statement for reporting randomized trials: explanation and elaboration. Ann Intern Med 2001;134:663-94.
  3. Ioannidis JP, Lau J. Completeness of safety reporting in randomized trials: an evaluation of 7 medical areas. JAMA 2001;285:437-43.
  4. Loke YK, Derry S. Reporting of adverse drug reactions in randomised controlled trials - a systematic survey. BMC Clin Pharmacol 2001;1:3.
  5. Ioannidis JPA, Evans SJW, Gøtzsche PC et al for the CONSORT Group. Better reporting of harms in randomized trials: an extension of the CONSORT statement. Ann Intern Med 2004;141:781-8.
  6. Marshall M, Lockwood A, Bradley C et al. Unpublished rating scales: a major source of bias in randomised controlled trials of treatments for schizophrenia. Br J Psychiatry 2000;176:249-52.
  7. Common toxicity criteria, version 2. Bethesda, Md.: National Cancer Institute, 1999.
  8. Gøtzsche PC. Non-steroidal anti-inflammatory drugs. London: BMJ Publica-tions, Clinical Evidence 2004;12:1702-10.
  9. Chan A-W, Hróbjartsson A, Haahr MT et al. Empirical evidence for selective reporting of outcomes in randomized trials: comparison of protocols to published articles. JAMA 2004;291:2457-65.
  10. Clarke M, Alderson P, Chalmers I. Discussion sections in reports of controlled trials published in general medical journals. JAMA 2002;287:2799-801.