Screening for mammacancer - to år efter

I en rapport fra 1997 anbefalede Sundhedsstyrelsen, at screening med mammografi blev indført i Danmark (1). De vigtigste argumenter for dette var, at tidlig påvisning af brystkræft vil føre til bedre helbredelsesmuligheder og mere skånsom behandling. Desværre holder disse argumenter ikke. Der er ikke pålidelig evidens for, at screening fører til bedre overlevelse (2-4), og der er god evidens for, at screening fører til, at flere kvinder mister et bryst (2, 3).

I januar 2000 publicerede vi i Lancet en kritisk gennemgang og metaanalyse af de syv store lodtrækningsforsøg af effekten af screening med mammografi (2). Vi har nu udarbejdet det Cochrane review, som Sundhedsstyrelsen og MTV-instituttet har bedt os om at gennemføre (3, 4). Dette review indeholder mere detaljerede og opdaterede analyser, der er baseret på over 200 artikler om screeningsforsøgene. Vi har desuden korresponderet ret indgående med de forskere, der har gennemført forsøgene, bortset fra Laszlo Tabár, den ansvarlige for det svenske Two-County Study, som ikke ønskede at samarbejde, hverken med os eller med de forskere, der har gennemført de andre screeningsforsøg, eller med andre metaanalytikere. Vi ved derfor nu mere om, hvad de vigtigste problemer i disse forsøg har bestået i.

Kvaliteten af forsøgene

Randomiseringen havde ført til sammenlignelige grupper i to af de syv forsøg, nemlig dem fra Canada og Malmø. I disse to forsøg kan man derfor regne med, at påviste gavnlige forskelle mellem screeningsgruppen og kontrolgruppen skyldes screeningen og ikke blot forskelle i prognostiske faktorer mellem grupperne ved starten af forsøget. De to dårligste forsøg, som er fra New York og Edinburgh, har vi udelukket fra de statistiske analyser, da de er helt upålidelige (3, 4). Den resterende gruppe af forsøg er svenske (Göteborg-studiet, Stockholm-studiet og Two-County Study), og de er alle problematiske, især Two-County Study, hvori vi har påvist så alvorlige problemer, at resultaterne fra dette forsøg formentlig også er ganske misvisende (3, 4).

Dødelighed af brystkræft er et upålideligt effektmål

Det primære effektmål i forsøgene er dødelighed af brystkræft. Dette effektmål er imidlertid upålideligt og biased til fordel for screening (3-6). Et screeningsforsøg, som blev påbegyndt i 1963 i New York, er særlig interessant, idet den mammografiske teknik på den tid var så dårlig, at man fandt nogenlunde samme antal tumorer i den screenede gruppe som i kontrolgruppen. Man ville derfor ikke forvente at se nogen effekt af screening, og man ville forvente, at dødsårsagen ville være uklar hos nogenlunde lige mange kvinder i screeningsgruppen som i kontrolgruppen. Dette syntes at være tilfældet, idet man udvalgte henholdsvis 71 og 73 kvinder til vurdering af et særligt blindet panel (3, 4). Der var imidlertid langt færre tilfælde end forventet i screeningsgruppen, der blev betegnet som dødsfald pga. af brystkræft, end i kontrolgruppen. Denne bias svarer til ca. halvdelen af den rapporterede gevinst af screening på brystkræftdødeligheden. Det er usandsynligt, at man i dette forsøg fandt nogen reel effekt af screening, idet en anden vigtig bias skyldes, at man udelukkede langt flere kvinder med tidligere brystkræft fra screeningsgruppen end fra kontrolgruppen (2, 4). Vi har da heller ikke endnu mødt nogen brystkræftforsker, som tror på, at den teknologi, som man anvendte tidligt i 1960'erne var tilstrækkeligt god. New York-studiet bliver ikke desto mindre fortsat fremlagt som dokumentation for, at screening har effekt (1, 7). Vi har fundet data fra Two-County Study og fra de svenske studier taget under ét, der på tilsvarende måde dokumenterer bias ved vurdering af dødsårsagen (3, 4).

Early Breast Cancer Trialists' Collaborative Group har publiceret data, som forklarer, hvorfor man selv med anvendelse af et blindet panel vil forvente at introducere bias, når dødsårsagen skal afgøres (5, 6). Det skyldes, at man ofte benytter postoperativ strålebehandling til cancere, der opdages tidligt. Strålebehandling nedsætter risikoen for lokalt recidiv med to tredjedele. En kvinde, der dør af brystkræft, men som ikke obduceres, og som ikke har tegn på lokalt recidiv, vil derfor kunne få diagnosen død af anden cancer, idet en hel del af de kvinder, der dør af brystkræft, har mere end én cancer (i Malmø-studiet var det ca. en femtedel). Det er derfor interessant, at de to bedste forsøg ikke fandt nogen effekt af screening på dødelighed tilskrevet kræft (inklusive brystkræft), relativ risiko 1,02 (95% sikkerhedsgrænser 0,95-1,10), og at estimatet for de tre svenske forsøg af dårlig kvalitet ganske svarede hertil, relativ risiko 1,00 (0,91-1,10) (3, 4).

Et andet overset problem er, at screening pga. den efterfølgende behandling i sig selv kan føre til øget dødelighed. Strålebehandling af lavrisikokvinder øger fx den totale dødelighed, og screeningspåviste cancere udgør netop en sådan lavrisikogruppe (5, 6). Da denne overdødelighed primært skyldes stråleskader på hjerte og kar, har disse dødsfald ikke været talt med som dødsfald pga. af brystkræft. Der er flere kvinder i screeningsgruppen end i kontrolgruppen, der har fået strålebehandling (2, 3), hvorfor denne bias favoriserer screening. Bias kan ikke påvises statistisk ved at sammenligne dødelighed af kardiovaskulære årsager i screeningsgruppen og i kontrolgruppen, idet antallet af kvinder med brystkræft er meget lille i forhold til antallet af de kardiovaskulære dødsfald blandt kvinder, der ikke har kræft. Men man kan se en tendens i den forventede retning (3, 4).

Den totale dødelighed og totale cancerdødelighed

Af begge de nævnte årsager giver brystkræftdødeligheden et alt for optimistisk billede af screeningens eventuelle effekt. Det er derfor nødvendigt at se på den totale dødelighed. Hvis screening reducerer brystkræftdødeligheden med ca. 30%, som man tidligere har hævdet (8), vil man forvente at finde en reduktion af den totale dødelighed på mindst 1%, hvilket svarer til en relativ risiko på højst 0,99 (efter at man har taget højde for, at screening ikke kan have effekt hos de kvinder, der allerede har fået konstateret brystkræft før deres indtræden i forsøget). Det finder man imidlertid ikke. Den relative risiko for død af alle årsager er 1,00 (95% sikkerhedsgrænser 0,96-1,05) i studierne fra Canada og Malmø. Dødeligheden er signifikant forhøjet i screeningsgruppen i de svenske forsøg taget under et (2), men falder til 1,00 (0,98-1,02) (9) efter justering for de forskelle i alder ved indtrædelsen i forsøgene, som er til stede trods forsøg på randomisering (2-4). Der er således ingen evidens for, at screening reducerer dødeligheden, der er ikke engang en tendens til en sådan effekt. Den totale cancerdødelighed, inklusive dødsfald pga. af brystkræft, er også den samme i screeningsgruppen som i kontrolgruppen (3, 4).

Dødelighed tilskrevet brystkræft

I de to bedste forsøg, der omfattede over 130.000 kvinder, fandt man ikke nogen effekt af screening på dødeligheden af brystkræft, relativ risiko 0,97 (95% sikkerhedsgrænser 0,82-1,14) efter 13 år (3, 4). For de tre svenske forsøg af dårlig metodologisk kvalitet var der tilsyneladende en signifikant effekt af screening på dødeligheden af brystkræft, relativ risiko 0,68 (0,58-0,78) efter 13 år (3, 4). Forskellen mellem de to effektestimater er signifikant (p=0,001). Dette tyder på, at estimatet, der er baseret på de mindre gode forsøg, er behæftet med bias. Bia s er i samme størrelsesorden som det, der er rapporteret i empiriske studier af bias, der er relateret til forsøg af dårlig metodologisk kvalitet (10).

Screening fører ikke til mere skånsom behandling

Vi har indhentet flere data om den kirurgiske aktivitet. Disse data bekræfter vore initiale resultater (2), nemlig at screening fører til, at 30-40% flere kvinder vil få udført kirurgi, og 20% flere kvinder vil blive mastektomeret (3).

Øgningen i mastektomifrekvensen er for stor til at kunne forklares med, at man finder en del prævalente tumorer, når man starter et screeningsprogram, og at der har været en ændring i behandlingspolitikken hen imod mindre brug af mastektomi. For eksempel var øgningen den samme i Stockholm efter den første screeningsrunde som i Canada og Malmø efter henholdsvis syv og ni års opfølgning, hvilket tyder på, at det ikke blot drejer sig om et initialt fænomen, som udjævner sig på langt sigt.

Screening fanger især de langsomtvoksende tumorer, som for manges vedkommende ikke ville have manifesteret sig i kvindernes resterende levetid, hvis de ikke havde deltaget i et screeningsprogram. Denne overdiagnostik og efterfølgende overbehandling er en uundgåelig konsekvens af screening. Et særligt problem udgøres af carcinoma in situ, som er den tidligste cancerlæsion af alle. Carcinoma in situ udgør næsten 20% af alle nyopdagede brystkræfttilfælde i USA, hvor screening er udbredt, og op mod halvdelen af dem behandles med mastektomi (11). Denne drastiske behandling skyldes, at læsionen ofte er diffust udbredt. Man kan sikkert nedsætte frekvensen af mastektomi i nogen grad ved tæt opfølgning og kvalitetssikring af kirurgernes indsats, men som nævnt vil problemet altid være til stede af rent biologiske årsager (4). Dertil kommer, at nogle kvinder givetvis vil forlange at få fjernet brystet for en sikkerheds skyld, uanset hvad kirurgen anbefaler.

Screening - to år efter

Både vi og Lancets redaktion har været udsat for megen kritik, der undertiden har antaget karakter af fordømmelse (12), men screeningsfortalerne har ikke kunnet modbevise vore resultater. Det er endvidere værd at notere sig, at de forsøg, hvori man har rapporteret om de største effekter på den del af dødeligheden, som forskerne har tilskrevet brystkræft, har haft relativt lange intervaller mellem indkaldelserne til screening (fx Two-County Study), inviterede en stor del af kvinderne til kun to eller tre screeninger (Two-County Study og Stockholm-studiet), begyndte at screene hele kontrolgruppen systematisk allerede efter 3-5 år (Two-County study, Göteborg-studiet og Stockholm-studiet) eller havde dårligt mammografisk udstyr (New York-studiet) (3, 4). Dette er paradoksalt, idet man ville forvente, at disse forsøg ville finde de mindste og ikke de største effekter.

Det er særlig bemærkelsesværdigt, at Two-County Study fandt den største effekt af samtlige forsøg. Hverken vi eller andre forskere, som vi har konsulteret, har imidlertid kunnet få de publicerede tal for antal kvinder og dødelighed til at passe sammen, når de forskellige publikationer om dette forsøg sammenlignes. Vi har fundet andre alvorlige diskrepanser, der svækker forsøgets troværdighed (3, 4). Det er også blevet påvist, at man i Two-County Study fandt alt for få cancere ved screening, der ikke havde spredt sig, til at det kan forklare den store effekt på dødeligheden af brystkræft, som forskerne har rapporteret om (13). Noget må være helt galt i dette studie, og vi håber derfor, at socialstyrelsen i Sverige, som har sponsoreret studiet, vil tage initiativ til, at det bliver reanalyseret af en uvildig, international forskergruppe, som får uhindret adgang til alle de originale data og dokumenter. Studiet har haft meget stor politisk betydning, idet det fx var grunden til, at screening blev indført både i Sverige og i Storbritannien. Vi mener derfor, at man skylder kvinderne at gennemføre en sådan analyse. Det er på høje tid; vi er langtfra de første eller de eneste, der har foreslået en kritisk granskning af dette forsøg (3, 4).

Disse observationer understreger, at forskellene i effekt mellem forsøgene skal søges i metodologiske forhold, hvilket vi tidligere har påpeget (2). Forskelle i kvaliteten af mammogrammerne eller screeningsprogrammerne kan ikke forklare disse fund (14).

Epidemiologiske sammenligninger

Vi vil kraftigt advare imod at fæste lid til data om screeningens gavnlige effekt, der bygger på ikke-randomiserede studier. For det første ville man næppe have ulejliget sig med at randomisere en halv million kvinder, hvis man havde kunnet opnå pålidelige resultater uden dette betydelige besvær. For det andet viser de studier, der allerede er lavet, hvor upålidelige sådanne sammenligninger er.

For nylig publicerede Tabár et al således i Cancer et nyt studie fra Two-County Study-området, som blev kaldt en landmark article i tidsskriftets leder. Man havde sammenlignet brystkræftdødeligheden i tre perioder: før screening, mens der løb et randomiseret forsøg, og efter at screening var indført (15). Forfatterne hævdede, at screening havde medført en reduktion af brystkræftdødeligheden på 50% (eller endog 63%, hvilket var det tal, der blev citeret i andre videnskabelige tidsskrifter). En sådan effekt er biologisk fuldstændig uplausibel, og der er da også flere fatale problemer med dette studie (16). Sammenligninger med andre historiske studier er også tankevækkende. I Storbritannien tilskrev man fx hovedparten af nedgangen i brystkræftdødeligheden den øgede anvendelse af tamoxifen, og kun 6% blev tilskrevet screening (dette estimat fandt forfatterne det endda umuligt at teste statistisk) (17). Det er også sært, at man i Storbritannien fandt, at en klar stigning i brystkræftdødeligheden i studieperioden blev afløst af en klar nedgang, hvorimod man i Sverige - hvorfra der er rapporteret om den største effekt af screening - har haft en meget langsom og konstant nedgang i brystkræftdødeligheden i 30-40 år uden nogen synlig effekt hverken af screening eller af indførelse af effektive behandlinger. De nyeste tal fra den svenske socialstyrelse bekræfter dette.

Etiske overvejelser

Vi konkluderede i Lancet, at screening for brystkræft med mammografi ikke er velbegrundet (2). Vore fortsatte undersøgelser har styrket denne konklusion (3, 4). Det er ikke dokumenteret, at screening fører til bedre overlevelse, hvorimod det er veldokumenteret, at screening fører til, at flere kvinder mister et bryst, og at flere kvinder bliver behandlet med stråleterapi (2, 3).

MTV-Instituttet stillede os den opgave at se på, om der er et sundt videnskabeligt grundlag for screening. Det mener vi ikke, at der er. Så længe man alligevel vælger at have screeningsprogrammer kørende i nogle lande eller regioner, er det etiske grundlag for screening imidlertid også vigtigt. Det har været et gennemgående træk over hele verden, at kvinder, som er blevet inviteret til at deltage i et screeningsprogram, ikke har fået fuld information om eventuelle skadelige virkninger (18). Et vigtigt argument for at undlade dette har været, at hvis man gjorde det, ville mange kvinder ikke møde op til screeningen (19). Dette synspunkt er utvivlsomt begrundet i, at man har troet på screeningens gavnlige effekt og har ønsket at gøre det bedste for kvinderne. I etisk forstand er det imidlertid en uacceptabel form for formynderi (20). Den er ikke ønsket af kvinderne, og den er desuden i modstrid med det alment accepterede princip om respekt for individets selvbestemmelse, hvilket forudsætter kvalificeret og fyldestgørende information også om skadevirkninger. Der er for nylig taget initiativ til, at de kvinder i Storbritannien, der inviteres til screening, bliver fuldt informeret. Dette bør også ske i Danmark. Vi håber også, at man fremover vil undlade at indkalde kvinder til screening med et brev, hvor der er be stilt tid i forvejen (21). Fremgangsmåden benyttes stadig, men den indebærer, at kvinden aktivt skal fravælge at møde op, hvilket selvsagt lægger et betydeligt psykisk pres på hende. Dette mener vi ikke kan forsvares af etiske årsager, og det videnskabelige grundlag foreligger heller ikke.

Vort Cochrane Review er støttet af MTV-Instituttet.

Antaget den 12. november 2001.

Det Nordiske Cochrane Center, København. E-mail: pcg@cochrane.dk

Litteratur

Screening for mammacancer - to år efter

Referencer