Kortlægningen af menneskets arvemasse er et af de vigtigste medicinske fremskridt i sidste århundrede, bl.a. fordi den åbner helt nye muligheder for at studere samspillet mellem genomet og omgivelserne, hvilket er hovedformålet med genetisk epidemiologi.
Et klassisk eksempel på genetisk epidemiologi var Harvalds & Hauges tvillingeundersøgelser (1), hvor sammenligning af konkordansraterne for monozygote og dizygote tvillinger viste, at der er genetiske bidrag til udviklingen af hyppige sygdomme som f.eks. kræft, forhøjet blodtryk, asthma og endog tuberkulose.
Perspektiverne for dette forskningsområde blev udvidet meget betydeligt, da man i løbet af 1970'erne fandt, at en række forskellige sygdomme med kompleks arvegang fortrinsvis opstår hos personer, der har arvet bestemte genetiske markører, idet HLA-vævstyperne viste sig at være særligt informative (2). Der fandtes således HLA-associationer ved bl.a. multipel sklerose, sukkersyge og kronisk leddegigt (Tabel 1 ), og de gav ny viden om, hvordan sygdomsdispositionerne nedarves. Danske undersøgelser viste således definitivt, at insulinkrævende (type 1) og ikkeinsulinkrævende (type 2) diabetes har forskelligt genetisk grundlag, idet kun den første er HLA-associeret. Fællesnævneren for HLA-associerede sygdomme er mistanke om autoimmunitet i patogenesen, og associationerne skyldes formentligt, at HLA-systemet spiller en central rolle i immunresponset.
Foruden HLA-associationerne, er der fundet associationer mellem andre genetiske markører og andre sygdomme, hvoraf nogle eksempler er anført i Tabel 1. Der er udført genomscanning for adskillige autoimmune sygdomme, men endnu er der ikke med sikkerhed fundet andre disponerende gener, selv om de sandsynligvis eksisterer.
Mannosebindende lektin (MBL) er et serumprotein, som spiller en vigtig rolle i det medfødte (innate) immunsystem (3). Proteinet binder bestemte sukkergrupper, som findes på overfladen af en række mikroorganismer, hvilket fremmer fagocytosen af disse. MBL viser genetisk polymorfi, idet det bl.a. rummer tre single nucleotide polymorphism (SNP)'er, som uafhængigt af hinanden bevirker en dominant nedsættelse af funktionelt MBL i blodet. Mere end en tredjedel af den danske befolkning er bærere af en MBL-variant. Proteinet er vigtigt i den tidlige barnealder, når de maternelle antistoffer er forsvundet ved seksmånedersalderen, og indtil barnets egne antistoffer er modnet ved 18-måneders-alderen. MBL-mangel kan også senere i livet virke som en negativ kofaktor og have prognostisk værdi ved flere sygdomme som f.eks. primære og sekundære immundefekter, cystisk fibrose og leddegigt.
To centrale metoder i genetisk epidemiologi er henholdsvis familie- og populationsundersøgelser (4). Familieundersøgelser er koblingsstudier, hvor man undersøger, om sygdommen nedarves sammen med bestemte genetiske markører. Populationsstudier er associationsundersøgelser, oftest i form af casekontrolstudier, hvor man sammenligner hyppighederne af genetiske markører hos en gruppe ubeslægtede patienter med de tilsvarende hyppigheder hos etnisk matchede, ubeslægtede, raske kontrolpersoner.
Fælles for de genetiske markører, der anvendes både ved familie- og populationsstudier, er, at de udviser polymorfi, dvs. at der findes to eller flere varianter i befolkningen.
Monogene sygdomme skyldes effekten af et enkelt gen. Den kromosomale placering af mange sådanne gener er blevet bestemt ved koblingsstudier, og det ansvarlige gen er derefter blevet identificeret ved såkaldt positionel kloning.
Polygene sygdomme har kompleks arvegang og er ofte multifaktorielle, dvs. de skyldes et samspil mellem genetiske faktorer og miljøfaktorer. Undersøgelser af afficerede søskendepar er en særlig anvendelig form for familieundersøgelser, fordi man eliminerer problemer med lav penetrans og varierende debutalder. Ved en række sygdomme med kompleks arvegang har man udført såkaldt total genomscanning, idet man har undersøgt søskendepar for et stort antal mikrosatellitsystemer spredt ud over hele genomet. Mens analysen af monogene tilstande som regel er forholdsvis enkel, er der betydelige problemer ved de polygene sygdomme. Det skyldes bl.a., at effekten af den enkelte allel ofte er lille, hvorfor der kræves store materialer for at opnå statistisk signifikans, og selv om der påvises signifikant kobling til et bestemt område af et kromosom, indeholder dette et stort antal gener, hvoraf mange teoretisk kan være kausale, dvs. årsag til dispositionen.
Koblingsstudier skal derfor følges op af associationsstudier i større patientgrupper. Her kan man få problemer med den såkaldte koblingsuligevægt, som viser sig ved, at genetiske markører, der sidder relativt tæt på hinanden, tenderer til at optræde sammen i det samme kromosom, dvs. i samme haplotype. Fænomenet er velkendt for HLA-systemet, hvor f.eks. HLA-B7-allelen på HLA-B-locus ofte optræder i samme haplotype som HLA-DR2-allelen på HLA-DR-locus. Dette er baggrunden for, at man kunne finde en association mellem multipel sklerose og HLA-B7, før man havde opdaget HLA-DR-locus. Nu ved man, at HLA-B7-associationen alene skyldes koblingsuligevægt mellem B7 og DR2, som er langt stærkere associeret med multipel sklerose end B7. Dette eksempel illustrerer, at selv om man har påvist association med en bestemt genetisk markør, er det ikke sikkert, at denne er ansvarlig for dispositionen. Koblingsuligevægt er udbredt i hele genomet, men med varierende styrke og udstrækning (5, 6).
Transmissionsdisequilibrium-test (TdT) kombinerer associations- og koblingsudersøgelser og kan udføres i familier med et afficeret barn, idet man tæller, hvilke to alleler på et givet locus barnet har arvet fra de to forældre, idet de ikke transmitterede alleler fungerer som kontroller. Metoden anbefales i genetisk heterogene befolkninger, hvor stratifikation kan føre til falske associationer i almindelige populationsstudier, fordi genetiske markører, der er karakteristiske for en af de befolkningsenheder, der indgår i den blandede befolkning, automatisk vil vise asscociation med en tilstand, som er særlig hyppig i denne enhed.
Genetisk epidemiologi opfattes ofte som studiet af samspillet mellem polymorfe gener og miljøet, men med de moderne molekylærbiologiske metoder kan der nu påvises ikkepolymorfe gener med betydelig effekt på sygdomsprocesserne. Med microarrays (7) kan man således vha. bioinformatik bestemme forskelle i ekspressionen af flere tusinde gener i forskellige væv, f.eks. maligne versus normale celler, eller mellem forskellige patologiske celletyper. Det er desuden vist, at forskelle i genekspressionsprofiler kan have prognostisk betydning.
Tilsvarende proteomanalyser baseret på massespektrometri kombineret med bioinformatik har f.eks. vist, at der ved ovariecancer er meget specifikke proteinprofiler i serum.
Den basale form for genetisk polymorfi er den såkaldte SNP, hvor der er forskel på en enkelt base i en bestemt position i DNA'et. Man kender nu flere mi o. SNP'er spredt ud i genomet, idet der gennemsnitligt findes en SNP for hver 3-6 kb, og næsten ethvert gen har således en eller flere SNP'er. Disse kan være lokaliserede både i de kodende dele af genet (exoner), hvor de kan give anledning til ændringer i aminosyresammensætningen og dermed funktionen af det endelige genprodukt, og i ikkekodende dele af genet, hvilket f.eks. kan have betydning for kontrollen med genekspressionen. Teoretisk kan man snart foretage komplette associationsstudier af hele genomet baseret på et stort antal SNP'er. Det har imidlertid vist sig, at associationsstudier baseret på haplotyper er mest informative, således som det i virkeligheden gælder for HLA, hvor de enkelte alleler i virkeligheden er haplotyper sammensat af mange SNP'er på hvert locus. Man er begyndt at etablere et haplotypekort over hele genomet (5), idet haplotyperne i bestemte områder kan fastlægges på basis af relativt få SNP'er (6).
Genetisk epidemiologiske undersøgelser kræver naturligvis adgang til biologisk materiale fra veldefinerede populationer af patienter og raske personer. Materialet kan indsamles på to måder: som befolkningsundersøgelser og som kohorter af patienter og kontrolpersoner. Ved befolkningsundersøgelser samles materialet fra store grupper raske personer. Efter en observationstid samkøres oplysninger om personerne med oplysninger fra nationale registre over diagnoser, dødelighed etc. Herefter kan man undersøge udvalgte patient- og kontrolgrupper for bestemte genetiske markører mhp. association. Kohortestudier af markører hos patienter og kontrolpersoner er en mere effektiv og direkte form for associationsstudier. Som regel har man væsentlig mere klinisk og laboratoriemæssig information om patientkohorterne, og man kan derfor bedre undersøge association mellem genetiske markører og forskellige forløbsformer af sygdomme (sygdomsmodificerende gener) samt respons på behandlinger. Der stilles således store forventninger til den såkaldte farmakogenetik mhp. optimering af behandling.
For tiden er mange biobanker med materiale (DNA, serum og/eller celler) fra patienter og raske kontrolpersoner under etablering i mange lande. Disse banker vil - sammen med de kliniske data - udgøre en potentiel guldgrube for den fremtidige genetisk-epidemiologiske forskning, både mht. genetiske markører og genekspressions- og proteinprofilstudier.
Ved associationsstudier kan det som nævnt være vanskeligt at bestemme, hvilket blandt flere gener der er årsag til associationen, og her kan funktionelle studier af celler, som isoleret kun udtrykker en af de forskellige alleler, hjælpe til at bestemme det mest sandsynlige gen.
De funktionelle studier kan suppleres med produktion og undersøgelser af genmanipulerede dyr, hvor man enten har inaktiveret det aktuelle gen (såkaldte knockoutdyr) eller dyr, hvor genet er stærkt udtrykt, samt transgene dyr, hvor man har indsat et nyt - f.eks. et humant - gen. Studier af HLA-transgene mus har således vist, at multipel sklerose kan opstå som følge af HLA-DR2-molekylets mulighed for at binde og præsentere et bestemt peptid fra hjernevæv for T-lymfocytter (8). Det er derfor sandsynligt, at det er HLA-DR2-genet selv og ikke et andet gen i koblingsuligevægt med DR2, der medfører en øget disposition for denne sygdom. Sådanne dyremodeller kan desuden anvendes til at teste nye behandlings- og forebyggelsesmetoder.
Et af effektmålene for den genetiske epidemiologi er netop at øge vor viden om patogenesen ved forskellige sygdomme for derved at få nye angrebspunkter for behandling og/eller forebyggelse. Et andet mål er at finde nye prognostiske markører, så behandlingen kan optimeres. Både klassiske genetisk-epidemiologiske studier af polymorfe genetiske markør og studier af genekspression med microarrays samt proteomanalyser kan bidrage til disse mål.
Arne Svejgaard , Klinisk Immunologisk Afdeling 7631, Rigshospitalet, Blegdamsvej 9, DK-2100 København Ø.
Antaget den 17. januar 2003.
Udgået fra Klinisk Immunologisk Afdeling 7631, Rigshospitalet, Blegdamsvej 9, DK-2100 København Ø.
Summary
Summary Genetic epidemiology. Ugeskr Læger 2003;165:927-9. Genetic epidemiology - i.e. studies of the interaction between genes and environment - has lead to the identification of monogenic disorders and more recently of genes involved in polygenic diseases by means of family (linkage) and populations (association) studies. The recent complete sequencing of the human genome combined with new methods such as gene expression analyses with microchip technology and proteome analyses including bioinformatics increases the possibility to find genes involved in various diseases and help to identify new targets for therapy and/or prevention.
Referencer
- Harvald B, Hauge M. Hereditary factors elucidated by twin studies. I: Neel JV, Shaw MW, Schull WJ, eds. Genetics and epidemiology of chronic diseases (Public Health Service Publication No. 1163). Washington, DC: U.S. Dept. Health, Education, and Welfare, 1965.
- Svejgaard A. MHC and disease associations. I: Herzenberg LA, Herzenberg LA, eds. Weir's handbook of experimental immunology in four volumes. 5th Edition. New York: Blackwell Scientific Publications, 1996: 37.1-37.13.
- Garred P, Pressler T, Madsen HO et al. Association of mannose-binding lectin gene heterogeneity with severity of lung disease and survival in cystic fibrosis. J Clin Invest 1999;104:431-7.
- Risch NJ. Searching for genetic determinants in the new millennium. Nature 2000;405:847-56.
- Daly MJ, Rioux JD, Schaffner SF et al. High-resolution haplotype structure in the human genome. Nat Genet 2001;29:229-32.
- Gabriel SB, Schaffner SF, Nguyen H et al. The structure of haplotype blocks in the human genome. Science 2002;296:2225-9.
- Schaid DJ. Special issue: genetic epidemiology and microarrays. Gen Epidemiol 2002;23:1-96.
- Madsen LS, Andersson EC, Jansson L et al. A humanized model for multiple sclerosis using HLA-DR2 and a human T-cell receptor. Nat Genet 1999;23:343-7.