Skip to main content

Screening for brystkræft

Nick E. Day

2. nov. 2005
9 min.

I en artikel i Lancet (1), kommenterer Gøtzsche & Olsen (GO) de syv randomiserede studier af screening for brystkræft, som er foretaget i Canada, Malmö, Göteborg, Stockholm, New York og Edinburgh samt det svenske Two-County-Study (der er et svensk toamtsstudie, som GO har behandlet som to forskellige studier; til trods for at det i virkeligheden var designet som et enkelt studie). De hævder, at bortset fra studierne i Canada og Malmö led de øvrige alle af så graverende fejl i designet, at resultaterne ikke er valide. Uden nærmere forklaring lader de også de nyeste resultater fra Malmö-studiet ude af betragtning og forholder sig således kun til de tidlige resultater fra Malmö, der blev publiceret i 1987. Eftersom GO alene baserer deres vurdering af mammografis betydning på resultaterne af det canadiske studie og de tidlige resultater fra Malmö-studiet, konkluderer de, at der ikke er ført bevis for at mammografiscreening reducerer mammacancermortaliteten. Denne konklusion står i direkte modsætning til de konklusioner, som stort set alle andre er kommet frem til i de senere år. Det være sig både grupper og enkeltpersoner. Man må derfor stille sig det spørgsmål, om GO har bidraget til at kaste yderligere lys over de eksisterende data, eller om deres analyse i hovedtrækkene må siges at være forkert. Jeg vil koncentrere mit svar om de svenske studier, eftersom de er de eneste, der har sammenlignet mammografi alene med ingen screening. Blandt de svenske studier er toamtsstudiet det største, og det fremstår i alle oversigter som det mest tungtvejende.

De argumenter, som GO har fremført, står og falder med validiteten af det svenske toamtsstudie. GO koncentrerer deres kritik om tre hovedpunkter: 1) Undersøgelsesgruppen var gennemsnitlig fem måneder ældre end kontrolgruppen. Ifølge GO er forskellen statistisk signifikant. 2) I en ujusteret analyse var der en mindre overdødelighed (alle årsager) i undersøgelsesgruppen. 3) Der har vist sig at være forskelle i størrelsen af undersøgelses- og kontrolgrupperne i forskellige publikationer.

De to første punkter er relateret til det faktum, at toamtsstudiet var gruppe (cluster )- og ikke individrandomiseret. Som enhver statistiker burde vide, vil cluster -randomisering føre til en større standardafvigelse på estimatet af effekten og til bredere sikkerhedsgrænser. Når man tager korrekt hensyn til randomiseringsproceduren, mister aldersforskellen mellem de to studiearme statistisk signifikans. Aldersforskellen indikerer derfor ikke, at der er tale om en så alvorlig fejl i studiedesignet, at det på nogen måde kan retfærdiggøre GO's underkendelse af undersøgelsens resultat. Det er simpelthen, hvad man kan forvente med den type randomisering. Cluster -randomisering er et helt acceptabelt design ved populationsbaserede undersøgelser og er ofte at foretrække frem for individbaseret randomisering dels af logistiske årsager, og dels for at reducere krydskontaminering af undersøgelsesgruppen. GO har en baggrund i hospitalsbaserede terapeutiske forsøg med individrandomisering og er måske mindre fortrolige med populationsbaserede forsøg.

Forfatterne til toamtsstudiet var på det rene med skævheden i aldersfordelingen og den lille forskel i totalmortaliteten i studiets to arme. De diskuterede netop disse to elementer i studiet udførligt i publikationer fra 1989 og 1992 (2, 3). De præsenterede to analyser: Den ene med aldersjustering, den anden hvor cluster -randomisering eksplicit indgik i analysen. Med hensyn til mammacancermortaliteten var de to analyser næsten sammenfaldende og gav relative risici for mammografigruppen på henholdsvis 0,69 (0,55-0,88) og 0,72 (0,58-0,90). Hvad angår totalmortaliteten, var resultatet af alderstilpasningen en reduktion af den relative risiko fra 1,02 (0,97-1,06) til 0,99 (0,95-1,03). For andre dødsårsager end mammacancer er tallene henholdsvis 1,03 (0,98-1,07) og 1,00 (0,96-1,04). Det står således klart, at studiets to arme inden for de respektive aldersgrupper er vel sammensat.

Det er derfor klart, at GO's to første kritikpunkter kan afvises. De mindre forskelle i aldersstrukturen og i totalmortaliteten ligger klart inden for de grænser, som man kan forvente, når man arbejder med cluster -randomisering. Der er ingen grund til at hævde, at designet er behæftet med alvorlige fejl. Hvad enten man udfører en analyse, der specielt gør rede for cluster -randomisering, eller man justerer for mindre aldersforskelle, så når man stort set til samme kvantitative konklusion: en høj signifikant reduktion på ca. 30% i mammacancermortaliteten i mammografigruppen. Hertil skal føjes, at der er gjort nøje rede for de små forskelle i totalmortaliteten i de to studiearmes aldersstruktur.

GO's tredje hovedkritikpunkt vedrører de undersøgte gruppers varierende størrelser i forskellige publikationer. Forfatterne har også diskuteret dette punkt i en tidligere publikation (2). Lige fra starten var det meningen, at man ville ekskludere de kvinder, der allerede havde fået stillet diagnosen mammacancer, før de blev randomiseret til studiet. GO retter en kritik mod dette eksklusionskriterium, hvilket blot viser deres manglende forståelse for screening. Det giver ingen mening, at man forsøger at evaluere en eventuel fordel ved tidlig diagnose blandt kvinder, der allerede har fået stillet diagnosen mammacancer. I den første publikation (4) gjaldt denne eksklusion kun for kvinder, der fik stillet diagnosen, eller som var døde af mammacancer i løbet af studiet. Dette skyldtes vanskeligheder med at sammenkoble hele studiepopulationen (mere end 100.000 kvinder) med Det Svenske Cancerregister på det tidspunkt. Inden publikationen i 1989 (2) havde man foretaget denne sammenkobling, og alle kvinder med en tidligere mammacancerdiagnose var blevet ekskluderet. Studiepopulationen er forblevet den samme fra dette tidspunkt.

Eftersom tidligere mammacancerdiagnoser var baseret på Det Svenske Cancerregisters objektive fortegnelser, er fejlmulighederne minimale. Hvis GO havde læst de referencer, som de omtaler fra toamtsstudiet med bare en smule opmærksomhed, ville de have kendt årsagen til ændringen af antallet i studiepopulationen. De kritikpunkter, de anfører, er således ubegrundede.

De kritikpunkter, som GO fremfører om toamtsstudiet, er decideret forkerte. De er baserede på en elementær misforståelse af cluster -randomisering og en overfladisk forholden sig til de artikler, som de hævder at have gennemlæst grundigt. Lignende mangler ligger også til grund for deres kritikpunkter af studiet i Göteborg. Mod Göteborg-studiet anfører de, at undersøgelsesgruppen var signifikant yngre end kontrolgruppen, nemlig 0,09 år, og at dette viser, at randomiseringen var inadækvat. En aldersforskel på 0,09 år har en ubetydelig effekt på den estimerede relative risiko for død af brystkræft, så kritikken er i det store hele indholdsløs. Men den er ikke bare indholdsløs, den er også malplaceret, eftersom den er baseret på manglende indsigt i designets detaljer. Ved studiet i Göteborg (5) blev individuelle fødselsårgange randomiseret successivt, og randomiseringsforholdet varierede i forhold til screeningskapaciteten. Der er derfor en mindre aldersskævhed i studiets design, som man må medtage i analysen. Eftersom aldersskævheden er minimal, er effekten af justerin g også minimal. Randomiseringen var imidlertid valid, og den endelige analyse var derfor korrekt. GO's kritikpunkter af studiet i Göteborg er simpelthen ukorrekte, og det ville de have vidst, hvis de havde læst beskrivelsen af studiedesignet.

GO's behandling af de øvrige studier er ikke mindre urimelig. De ignorerer de nyere resultater fra studiet i Malmö (6), der viser en relativ mammacancermortalitet på 0,81 i screeningsarmen. Dette resultat falder i tråd med de andre svenske studier. GO tager kun hensyn til de tidligere resultater, som er forældede. Den canadiske undersøgelse får en overraskende overfladisk behandling, og det kan derfor undre, at de bedømmer den til at være »langt den bedst dokumenterede«. For det første er det canadiske studie ikke blot ét studie, men to, idet sammenligningen af de kvinder, der er under 50 år adskiller sig fra sammenligningen af de kvinder, der er over 50 år. For kvinderne over 50 år bestod sammenligningen af mammografi plus en objektiv undersøgelse kontra lægeundersøgelse alene. Det vil sige, at undersøgelsen evaluerer effekten af mammografien oven på en objektiv undersøgelse. GO diskuterer dette ganske kort, men blander selvundersøgelse af brystet sammen med en brystundersøgelse, der er foretaget af en faguddannet sygeplejerske. Dette forsøg burde egentlig ikke tages i betragtning, når man evaluerer mammografi som den eneste screeningsmodalitet. For kvinderne under 50 år sammenlignede man den objektive undersøgelse plus mammografi med ingenting. For det andet lovpriser GO randomiseringen i det canadiske studie, til trods for at der er tydeligt bevis på skævhed i den vigtigste variabel af dem alle: forekomst af fremskredne tumorer ved studiets start (7). For det tredje ser GO helt bort fra den uafhængige kritik, der blev rettet mod kvaliteten af de canadiske studiers mammografier, hvor det blev konkluderet, at den generelle kvalitet var ringe. Der er ingen, der vil antyde, at ringe mammografi er en anvendelig screeningsmodalitet.

På grundlag af ovennævnte punkter må man derfor sige, at GO udviser en mildest talt ringe dømmekraft, når de fremhæver, at netop de canadiske undersøgelser giver det bedste bevis på mammografiens betydning som screeningsmetode.

GO argumenterer med at brystkræftdødeligheden ikke er det rette slutmål. De finder det for upræcist. Da brystkræftdødeligheden er det, som man ved brystkræftscreening tilstræber at ændre, er det klart, at det er det, der skal bruges primært i bedømmelsen af studierne. Det blev allerede for mange år siden vist i en af artiklerne fra toamtsstudiet, at man ikke kan bruge totalmortaliteten som slutmål (2).

I enkelte tilfælde kan det være vanskeligt at bestemme dødsårsagen hos kvinder, der har fået stillet diagnosen brystkræft, men i de svenske studier blev der gjort en stor national indsats for blindet og på ekspertniveau at bestemme dødsårsagen. Muligheden for bias er minimal.

Derudover blev den reducerede brystkræftdødelighed i screeningsarmen forudgået af en tilsvarende reduktion i antallet af avancerede brytstkræfttilfælde i screeningsarmen. Denne reduktion er klart uafhængig af, hvilken årsag man senere angiver som dødsårsag.

Man må sige, at GO behandler (de tidligere) studier vilkårligt og tilfældigt. Deres afvisning af de tre svenske studier (toamtsstudiet, Göteborg-studiet og Stockholm-studiet) er fuldstændig uberettiget og viser en manglende forståelse af det populationsbaserede design, cluster-randomisering og manglende evne til omhyggeligt at læse de videnskabelige artikler, som de citerer. Deres behandling af studiet i Malmö er simpelthen urimelig, og deres vurdering af de canadiske studier er utilstrækkelig og partisk. Populationsscreening for mammacancer ved hjælp af mammografi er et yderst vigtigt samfundsmedicinsk spørgsmål. Der er en generel enighed om, at for kvinder over 50 år er fordelen ved mammografi betydelig. GO's kritik er yderst inkompetent og værdiløs. The Lancets beslutning om at publicere artiklen var beklagelig og uansvarlig. Man må håbe, at de instanser, der er ansvarlige for implementeringen af screening for mammacancer, ikke fæster lid til GO's kritik.

Forfatteren gør opmærksom på, at hovedparten af denne artikel er skrevet længe før offentliggørelsen af Cochrane-reviewet. Da det imidlertid har vist sig, at Gøtzsche & Olsen ikke har taget nogen af de mange publicerede kritikpunkter til efterretning, men gentaget fejlene i Cochrane-reviewet, er kritikken stadig velbegrundet.

Antaget den 9. november 2001.

University of Cambridge, Strangeways Research Laboratory.

Oversat af Iben Wulff Holten, Kræftens Bekæmpelse, København.

Litteratur

Referencer

  1. Olsen O, Gøtzsche PC. Cochrane review on screening for breast cancer with mammography. Lancet 2001; 358: 1340-2.
  2. Tabar L, Fagerberg G, Duffy SW, Day NE. The Swedish two county trial of mammographic screening for breast cancer: recent results and calculation of benefit. J Epidemiol Community Health 1989; 43:107-14.
  3. Tabar L, Fagerberg G, Duffy SW, Day NE, Gad A, Grontoft O. Update of the Swedish two-county program of mammographic screening for breast cancer. Radiol Clin N Am 1992; 30: 187-210.
  4. Tabar L, Fagerberg CJ, Gad A, Baldetorp L, Holmberg LH, Grontoft O et al. Reduction in mortality from breast cancer after mass screening with mammography. Randomised trial from the Breast Cancer Screening Working Group of the Swedish National Board of Health and Welfare. Lancet 1985; 1: 829-32.
  5. Bjurstam N, Bjorneld L, Duffy SW, Smith TC, Cahlin E, Eriksson O et al. The Gothenburg breast screening trial: first results on mortality, incidence, and mode of detection for women ages 39-49 at randomization. Cancer 1997; 80: 2091-9.
  6. De Koning HJ. Assessment of nationwide cancer-screening programmes. Lancet 2000; 355: 80-1.
  7. Miller AB, Baines CJ, To T, Wall C. Canadian National Breast screening Study: 1. Breast cancer detection and death rates among women aged 40 to 49 years. Can Med Assoc J 1992; 147: 1459-76.