Epidemiologien er den del af sundhedsvidenskaben, hvor man måler forekomsten af sygdomme i befolkningen, og hvor man systematisk søger at sætte navn på determinanterne for sygdom. Genetisk epidemiologi er en ung, men hurtigt voksende disciplin, hvor man søger at integrere genetiske og epidemiologiske tilgange til forståelse af sygdom, dvs. at afdække de familiære determinanter for sygdom og at beskrive samspillet mellem genetiske og ikkegenetiske faktorer i årsagskæden, som fører til sygdom [1].
Interessen for de genetiske determinanter for kroniske sygdomme har været stigende. Umiddelbart kan udviklingen synes mærkelig, fordi der er datamæssigt grundlag for at hævde, at miljøet spiller en dominerende rolle. Det gælder for store sygdomsgrupper som forhøjet blodtryk, astma, depression og kræft. Ikke desto mindre er der et voksende videnskabeligt grundlag for synspunktet, at den genetiske variation fra menneske til menneske er en vigtig forudsætning for en rigtig forståelse af miljøets negative indvirkning på helbredet. Det er i udforskningen af de komplekse sygdomme, heriblandt kræft, og dispositioner herfor, at den genetiske epidemiologi som forskningsfelt er allermest lovende, om end identifikationen af genetiske varianter, der disponerer for komplekse sygdomme, har vist sig at være betydelig vanskeligere, end man havde forudset. Større studier, mere intensiv genotypebestemmelse og stærkere statistiske værktøjer ventes at forbedre mulighederne.
Genetikkens genstandsfelt er at identificere genetiske faktorer som årsag til specifik sygdom, ofte med en sammenhæng, der indikerer et gen - en sygdom. Det humane genomprojekt i 1990'erne har medvirket til, at der er identificeret et stort antal gener, der er involveret i monogene sygdomme med kendt fænotype, herunder syndromer associeret med cancer, som von Hippel Lindaus syndrom, hereditær nonpolypøs kolorektal cancer (HNPCC), hereditær bryst- og oivariecancer (HBOC) og mange flere. Det er landvindinger, som har styrket troen på, at genetisk prædisponering for sygdom er vigtig - også i de tilfælde, hvor tendensen til en familiær ophobning ikke har kunnet forklares ved en simpel mendelsk arvegang. I denne statusartikel ser vi specielt på kræftområdet.
Genetisk epidemiologi og kræft
I dag har en betydelig del af forskningen i årsager til kræft genetisk epidemiologi som metodemæssig platform. Det er - på trods af den dominerende miljømæssige genese - ikke helt så mærkeligt, eftersom kræft er cellens sygdom; alt tyder på, at trinene i karcinogenesen er et resultat af et sæt af genetiske malfunktioner.
Genetisk epidemiologi på kræftområdet sigter således mod: 1) at påvise det genetiske aspekt i årsagsbilledet, 2) at lokalisere og funktionsbestemme det eller de gener, som er årsag til den forøgede kræftrisiko, og 3) at måle størrelsen af det årsagsmæssige bidrag fra de involverede gener og fra samspillet mellem generne og miljøet. I genetisk epidemiologi fokuserer man på den del af kræftforekomsten, som er afhængig af den genetiske variation i befolkningen, men man skal samtidig tage højde for det konkrete miljø, fordi visse af de genetiske varianter kun øger kræftrisikoen, hvis personen eksponeres for den rette faktor.
Tabel 1 giver en forenklet opstilling af arv og miljø, som driver sygdomsforekomsten. Tabellen illustrerer, at arvelige faktorer i nogle tilfælde øger risikoen for sygdom betydeligt, uden at yderligere eksponering synes at være nødvendig (arvelig kræft), som det ses ved retinoblastom og familiær colonpolypose (FAP). Faktisk er der i kliniske og epidemiologiske undersøgelser til dato beskrevet mere end 450 monogene tilstande, hovedsageligt dominante, som er associeret med en forøget forekomst af kræft [2]. Hver for sig forekommer de sjældent, nogle af dem endog ekstremt sjældent, således at de samlet set næppe udgør mere end 5% af kræftbilledet [3, 4].
Tabel 1 viser tilsvarende, at faktorer i miljøet kan være kræftfremkaldende uafhængigt af personens genetiske konstitution (miljøbetinget kræft). Her er der tale om godt 90 velbeskrevne kemiske, fysiske og biologiske påvirkninger, der af arbejdsgrupper under International Agency for Research on Cancer er dokumenteret at være kræftfremkaldende for mennesket, og knapt 70 påvirkninger, der mistænkes for at være kræftfremkaldende for mennesket [5]. En nordisk arbejdsgruppe har vurderet, at disse miljøpåvirkninger i det danske samfund forklarer omkring 30% af kræftbilledet [6].
Men Tabellen illustrerer også, at der er kræfttilfælde, som initieres af en miljøpåvirkning i samvirkning med specifikke varianter af et eller flere sårbarhedsgener (susceptibility genes ). Baggrunden betegnes ofte som »kompleks« eller som et resultat af en gen-miljø-interaktion, og generne betegnes af nogle som effektmodificerende sårbarhedsgener. Det vurderes, at der er tale om genvarianter, som i hyppighed ikke er helt sjældne, og at de hver for sig påtvinger individet en forholdsvis beskeden risikoforøgelse for kræft. En kombination af CYP1A1+ og eksponering for tjærestoffer (polycykliske aromatiske carbonhydrider (PAH'ere)) og en følgende forøget risiko for lungekræft eller kombinationen af NAT2- og eksponering for benzidin og en følgende reduceret risiko for blærekræft er eksempler på sådanne samspil [7].
Endelig viser Tabel 1, at vi må regne med, at der er en gruppe kræftsygdomme, som hverken har en arvemæssig eller en miljømæssig baggrund, og som bedst kan karakteriseres som spontane, formentlig på grund af spontane DNA-mutationer, som ikke repareres af cellen; nogle af disse mutationer kan persistere og lede i karcinogen retning. Størrelsen af problemet er af gode grunde ukendt, men kan måske estimeres som den andel af kræftmønsteret i Danmark, som svarer til den laveste incidens af hver enkelt kræftform, som er observeret på verdensplan. I så fald udgør den spontane forekomst maksimalt 10% af kræfttilfældene herhjemme.
Strategi og metoder i genetisk epidemiologi
I Tabel 1 ses en oversigt over metoder, som anvendes i genetisk epidemiologi, og spørgsmål, som man med forskningen gerne vil besvare [1]. Rækkefølgen er trinvis (trin 1-5) og ordnet traditionelt, men metodeudvikling og genteknologi har betydet, at rækkefølgen ikke altid følges.
Familier med mange kræfttilfælde (trin 1)
Undersøgelser af forekomsten af sygdom i familier er det klassiske udgangspunkt for genetisk epidemiologi. I mange tilfælde er mistanken om et genetisk bidrag til en sygdom etableret på basis af en klinisk iagttagelse af en ophobning af en eller flere afgrænsede sygdomme i udvalgte familier. For eksempel fik udnyttelsen i 1969 af et amerikansk register, hvori man gennem flere år havde opsamlet sporadiske oplysninger om familier med mange kræfttilfælde, Frederick P. Li & Joseph F. Fraumeni på sporet af det cancersyndrom, som i 1982 fik navnet Li-Fraumenis syndrom. I dag ved vi, at Li-Fraumenis syndrom, defineret som en familiær forekomst af flere kræfttilfælde diagnosticeret inden 45-års-alderen af typerne sarkom, præmenopausal brystkræft, akut leukæmi, hjernetumor og adrenokortikalt karcinom som regel skyldes en nedarvet mutation i tumorsuppressorgenet p53 [8].
Men erfaringen viser, at der ofte skal kontrollerede, epidemiologiske studier til, før det på et formelt grundlag bliver muligt at tolke en familiær ophobning af kræfttilfælde som værende reel eller falsk. Familiær ophobning i epidemiologisk forstand betyder, at der i gennemsnit ses flere tilfælde af en given sygdom hos nære slægtninge til personer, som har sygdommen, end hos nære slægtninge til personer, som ikke har sygdommen. Af hensyn til etableringen af pålidelige risikoestimater er det vigtigt, at undersøgelsen af familiær ophobning bygger på et repræsentativt udsnit af befolkningen, dvs. at undersøgelsen er befolkningsbaseret. En klinisk database eller et landsdækkende cancerregister er et effektivt udgangspunkt for sådanne undersøgelser. Fremgangsmåden er enkel, fordi kræft er et binært udfald, og studiet kan tilrettelægges som en regelret kohorteundersøgelse. Fra registeret udvælges personer med den ønskede fænotype (f.eks. afgrænset efter cancerform, histologi, køn og alder ved diagnose), og slægtninge opspores, f.eks. via Folkeregisteret og kirkeregistre. Herefter anvendes Cancerregisteret, når man bestemmer forekomsten af syndromcancere hos gruppen af slægtninge. I familier med mere end et tilfælde er probanden definitorisk den person, som først får diagnosen, og de øvrige indgår i gruppen af slægtninge. Den observerede forekomst af syndromcancere i kohorten af slægtninge sammenholdes med det forventede ud fra de normale rater for cancer i befolkningen, multipliceret med det samlede antal år (personår) under observation. Alternativt kan der som kontrolkohorte anvendes personer, som har giftet sig ind i de valgte familier. I denne type af undersøgelser har Danmark og de øvrige nordiske lande stærke, registermæssige forudsætninger.
Tvillingeundersøgelser
Undersøgelser af tvillingepar udgør en særlig undergruppe af familieundersøgelser. En sammenligning af ligheden i kræftforekomsten (konkordansen) mellem på den ene side enæggede tvillinger og på den anden side tveæggede giver informationer om, hvorvidt det familiære kræftmønster er arveligt eller miljøbetinget. Hvis en undersøgelse af et stort antal tvillingepar f.eks. viser, at konkordansen for en særlig kræftform hos enæggede tvillinger (som har alle gener til fælles) er stærkere end konkordansen hos tveæggede (som kun har halvdelen af genernes til fælles) er det arvelige aspekt i sygdommen formentlig vigtig. Hvis konkordansen er den samme hos de enæggede som hos de tveæggede, er fælles miljøfaktorer uden tvivl vigtigere. Man kan direkte beregne heritabiliteten, dvs. den del af sygdomsforekomsten, der kan tilskrives genetiske forskelle. På basis heraf kan man, som det blev gjort i en fælles nordisk tvillingeundersøgelse [10], give en beskrivelse af arvens betydning for de enkelte kræftformer og for kræft som helhed. I undersøgelsen konkluderede man, at arvelige faktorer var væsentlige for prostatakræft (42%), kolorektal kræft (35%) og brystkræft (27%), hvorimod man med arvemæssige faktorer kun kan forklare en mindre andel af befolkningens modtagelighed over for de fleste andre kræftformer [9]. Den vigtigste begrænsning i undersøgelser af tvillingepar er imidlertid, at antallet af personer sjældent er stort nok til, at man kan yde præcise estimater på den relative betydning af arv og miljø, og at de ikke er egnede, når man skal vurdere betydningen af eventuelle interaktioner. Det er ikke forventeligt, at vi i en overskuelig fremtid på kræftområdet vil se tvillingeundersøgelser, der er større end den nordiske.
Generelt tilvejebringes der hverken i familie- eller tvillingeundersøgelser dokumentation for, hvilke biologiske mekanismer der er involveret, og det er derfor heller ikke muligt på den baggrund endeligt at afklare genetiske faktorers betydning. Familiær ophobning af sygdom udelukker nemlig ikke en miljømæssig baggrund.
Modeller for nedarvning og genetiske markører
(trin 2-4)
I de videre undersøgelser af genernes betydning for sygdom benyttes der forskellige metoder og veje, som omfatter segregationsanalyser og koblings- og associationsundersøgelser som f.eks. brug af chipteknologi og skanning af genomet for enkeltnukleotidpolymorfier og etableringen af biobanker har afgørende forbedret mulighederne for dette.
Segregationsanalyser
Før den detaljerede viden om DNA (og de følgende store teknologiske landvindinger) måtte genetikken alene baseres på den biologiske model for, hvordan gener nedarves og deles mellem nære slægtninge som beskrevet i Mendels love. Denne forskning tager udgangspunkt i et stort antal slægtstræer (stamtræer), idet man på grundlag af gentagelsesrisiko og -mønster kan teste forskellige teoretiske typer af arvegange. Denne forskningstradition er blevet udbygget og stadigt forfinet med brug af varianskomponentmodeller og komplekse segregationsanalyser. På basis af en biologisk rationel model, som fortæller, hvordan en given fænotype moduleres af et eller flere gener, hvert med et givet antal alleler, afprøver man i varianskomponentanalysen, om en hypotetisk model er konsistent med den observerede familiære fordeling af fænotypen, og man kan i givet fald skønne over den samlede arvelige komponent i sygdommen. Hvis analyserne tyder på, at der er et eller kun få udslagsgivende gener bag sygdommen kan man vha. segregationsanalyser sandsynliggøre den mere specifikke arvegang. Men med disse statistiske redskaber er man ikke i stand til at lokalisere, hvor på DNA'et fejlen ligger.
Koblingsanalyser
Den genetiske koblingsanalyse gør det muligt at lokalisere gener, som man kun kender gennem fænotypen, og hvor genotypen i sygdomslocus med stor sikkerhed kan forudsiges [10]. Af Mendels 2. lov fremgår, at to forskellige egenskaber nedarves uafhængigt. Det gælder for egenskaber, hvor de gener, der er bestemmende, er placeret på hvert sit kromosom. Hvis to loci ligger tæt på hinanden på samme kromosom, vil egenskaberne derimod følges ad ved nedarvningen, medmindre der opstår overkrydsning i meiosen med en rekombination i næste generation som resultat. Jo tættere to loci ligger på hinanden, jo mindre sandsynligt er det, at en rekombination vil indtræffe. Ved hjælp af et stort antal polymorfe DNA-markører (dvs. markører med kendt placering, spredt rundt om i genomet) kan man i familier, hvor sygdommen segregerer, undersøge, om sygdommen udviser genetisk kobling til en eller flere af markørerne. For hver markør bestemmes rekombinationshyppigheden mellem markør og locus. En udvikling heraf er lodscore-metoden, hvorigennem man vælger den rekombinationsfraktion, hvormed man bedst kan forklare data. Koblingsanalyser har været brugt til at lokalisere gener for flere monogene tilstande, f.eks. HBOC og BRCA1 . I nogle tilfælde anvendes andre strategier i koblingsanalysen, f.eks. ved særlige undersøgelser af afficerede søskendepar. Metoden anvendes ved komplekse sygdomme, hvor arvegang og penetrans ikke er kendt.
Associationsundersøgelser ( trin 5)
Koblings- og associationsstudier komplementerer hinanden, men er samtidig grundlæggende forskellige. I associationsstudiet undersøger man, om en målbar genetisk variant, f.eks. et allel, en DNA-sekvens eller en genetisk markør på populationsniveau er associeret med en given fænotype, idet hyppigheden af varianten hos henholdsvis afficerede personer og kontrolpersoner sammenlignes. Sådanne studier svarer til traditionelle epidemiologiske undersøgelser, hvor determinanten eller »eksponeringen« er den genetiske variant, og hvor man gennem designet søger at neutralisere virkningerne af potentielle konfoundere. Et optimalt design er case-kontrol-undersøgelsen indlejret i en prospektiv kohorteundersøgelse, hvor udgangspunktet er epidemiologiske biobanker. Sådanne er f.eks. opbygget for »Kost, Kræft og Helbred-kohorten« og »Bedre Sundhed for Mor og Barn-kohorten«. Men også andre former for case-kontrol-undersøgelser er hyppigt anvendt. De genteknologiske landvindinger har betydet, at det er muligt i biologisk materiale at undersøge i hundredvis til tusindvis af specifikke variationer i genomet på en gang. Feltet er derfor naturligt et samarbejde mellem epidemiologer og genetikere, fordi undersøgelser af gen-gen- og gen-miljø-interaktioner i associationsundersøgelser kræver store undersøgelsesgrupper, for at man kan opnå en tilfredsstillende præcision for risikoestimatet. Der vil typisk være behov for case-kontrol-undersøgelser, som inkluderer mindst 1.000 personer med den relevante fænotype og et tilsvarende antal kontrolpersoner.
Et innovativt forskningsområde, som kan få stor betydning for genetisk epidemiologiske studier af kræft, er registrering og opfølgning af patienter, som har været behandlet for kræft. En detaljeret dokumentation af den anvendte kemoterapi og strålebehandling, der jo ofte i sig selv har karcinogene virkninger, vil i takt med forbedringer af overlevelseschancerne for gruppen give usædvanlige muligheder for in vivo-forskning i gen-miljø-interaktioner i karcinogenese hos mennesker, når det drejer sig om risiko for en ny primær kræft, og i de biologiske mekanismer, som er involverede. Et kendskab til disse mekanismer hos den kræftbehandlede patient kan uden tvivl udnyttes i den generelle forebyggelse og behandling af kræft.
Ætiologisk fraktion af arv og miljø - betydning for forebyggelsen
Overvejelserne om en gen-miljø-interaktion i årsager til kræft bringer god orden på diskussionen om arvens og miljøets relative betydning. Med henvisning til Tabel 1 kan man på kræftområdet hævde, at effekterne af de arvelige determinanter og de rene miljøkarcinogener (først og fremmest aktiv og passiv tobaksrygning, visse erhvervsudsættelser, et kronisk alkoholoverforbrug, radon, anden ioniserende stråling, sollys, svær overvægt, eksogene kønshormoner, ringe fysisk aktivitet og visse infektioner) er kortlagte, og at der næppe kan forventes mange nye emner i disse kategorier. Figur 1 er et godt bud på, hvordan fordelingen af de godt 27.000 nye kræfttilfælde (nonmelanom hudkræft fraregnet), som blev registreret i Cancerregisteret i løbet af 2000 ser ud, når principperne fra Tabel 1 appliceres på virkeligheden.
Det anslås, at omkring 1.500 kræfttilfælde årligt (ca. 5%) har en eksklusiv genetisk baggrund, og at godt 8.000 tilfælde (30%) er miljøbetingede. Hertil kommer så maksimalt 3.000 tilfælde (ca. 10%), som må formodes at være »spontane«. På dette grundlag er der god grund til at tro, at resten, dvs. 14.500 tilfælde (ca. 55%) er forårsaget af - hidtil uudforskede - samspil mellem generne og miljøet. Årsagerne til de godt 8.000 miljøbetingede kræfttilfælde kendes, og de er umiddelbart tilgængelige for forebyggelse [7]. I et fremtidsscenarium med øget kendskab til, hvilke sammensætninger af miljøfaktorer og specifikke genvarianter der særligt disponerer for kræft, er der principielt mulighed for »individualiseret« forebyggelse.
Jørgen H. Olsen , Institut for Epidemiologisk Kræftforskning, Kræftens Bekæmpelse, DK-2100 København Ø.
E-mail jorgen@cancer.dk
Antaget: 20. marts 2006
Interessekonflikter: Ingen angivet
Summary
Summary Genetic epidemiology and cancer Ugeskr Læger 2006;168(24):2344-2348 Genetic epidemiology focuses on the familial and, in particular, genetic, determinants of disease and the joint effects of genes and environmental factors. Thus, genetic epidemiology aims at quantifying the risk of disease, cancer included, associated with genetic variation within a given population. In spite of the fact that most cases of cancer are initiated based on environmental exposures accumulated during a life-time, the carcinogenetic process itself is governed by a set of specified and unspecified genetic malfunctions, making genetic epidemiology a valuable methodological platform in cancer research. Details are given on known and suspected causes of cancer, including presumable gene-gene and gene-environment interactions.
Referencer
- Burton P, Tobin MD, Hopper JL. Key concepts in genetic epidemiology. Lancet 2005;366:941-51.
- Mulvihill JJ. Catalogue of human cancer genes. I: McKusick's Mendelian inheritance in man for clinical and research oncologists. Baltimore: John Hopkins University Press, 1999:1-646.
- Li FP. Phenotypes, genotypes, and interventions for hereditary cancers. Cancer Epidemiol Biomarkers Prev 1995;4:579-82.
- Fearon ER. Human cancer syndromes: clues to the origin and nature of cancer. Science 1997;278:1043-50.
- www-cie.fr/monoeval/allmonos.html/ januar 2006.
- Olsen JH, Andersen A, Dreyer L, et al. Avoidable cancers in the Nordic countries. APMIS 1997;76:1-146.
- Carreón T, Ruder AM, Schulte PA et al. NAT2 slow acetylation and bladder cancer in workers exposed to benzidine. Int J Cancer 2006;118:161-8.
- Li FP, Fraumeni JF Jr. Soft-tissue sarcomas, breast cancer, and other neoplasms. Ann Intern Med 1969;71:747-52.
- Lichtenstein P, Holm NV, Verkasalo PK et al. Environmental and heritable factors in the causation of cancer. N Eng J Cancer 2000;343:78-85.
- Teare MD, Barrett JH. Genetic linkage studies. Lancet 2005;366:1036-44.