Genetisk epidemiologi - fra gen til sygdomsforståelse

Baggrund

Den tredimensionale DNA-struktur blev beskrevet af James Watson & Francis Crick i 1953, og 50 år efter, i 2003, blev det humane genomprojekt (HUGO) afsluttet. HUGO havde til formål at sekventere de ca. 3 milliarder basepar, der udgør det humane genom. Geno-met indeholder ca. 25.000 gener. Der er en høj grad af identitet med andre dyrearter; for eksempel er der mere end 99% identitet mellem menneske og chimpanse. Kun en mindre del af genomet translateres, den øvrige del har blandt andet regulerende funktioner.

Naturligt forekommende genetiske varianter

Genetiske variationer, dvs. forskelle i sekvensen mellem to kopier af det humane genom, er beskrevet i det internationale HapMap-projekt [3]. De er særdeles talrige, idet der er mere end 10 millioner variationer i det humane genom. Det drejer sig om variationer i genkopisekvenser (large-scale copy number variation (CNV): variationer i antallet af kopier af et givet DNA-stykke), repetitive sekvenser, insertioner og deletioner og forskelle i nukleotidsekvensen. Langt de fleste varianter består i en ændring af et enkelt basepar i DNA-sekvensen, såkaldte single nucleotide polymorphisms (SNP'er) (Figur 1 ).

Fra genotype til fænotype

Genetiske varianter, som ændrer funktionen af genproduktet, kaldes funktionelle varianter. Det kan for eksempel skyldes ændringer i aminosyresekvensen (non-synonymous (ns) SNP'er) af det protein, genet koder for. Der kan også være via ændringer i stabiliteten af messenger -ribonukleinsyre (mRNA) eller i gen- eller proteinekspressionen som følge af ændringer i bindingen af regulerende molekyler. Mange polymorfier er dog uden kendt betydning. I jagten på sygdomsassocierede gener kan SNP'er bruges som markører for et gen eller locus, hvis de er tæt koblet til de risikomodificerende genetiske varianter (linkage dis-equilibrium, LD).

Metoder til identifikation af risikomodificerende gener

Traditionelt har man anvendt koblingsanalyse (linkage analysis ), hvor målet er at identificere genomiske regioner, som tenderer til at nedarves sammen med sygdommen. Koblingsanalyser er velegnede til studier af sygdomme, der er karakteriseret ved, at

1) flere generationer kan være afficerede, at 2) overlevelsen ikke påvirkes nævneværdigt, samt 3) at det risikobærende allel er sjældent i populationen og medfører en høj risiko for sygdommen (høj penetrans).

De senere år har associationsanalyse vundet større udbredelse. Undersøgelsen bygger på sammenligninger af frekvensen af specifikke genvarianter -(alleler) mellem cases og kontroller. Association-analysen er velegnet, når der er tale om risikobærende alleler, der er hyppige i populationen. Analysen kan endvidere bruges, når det enkelte allel kun medfører en beskeden ændring af sygdomsrisikoen, hvilket som nævnt karakteriserer komplekse sygdomme, som involverer flere gener med lav penetrans og ofte interaktioner med en eller flere miljøfaktorer (Figur 2 ).

Associationsanalysen kan være hypotesegenereret eller hypotesefri. Kandidatgen-associationsstudier (candidate gene association studies ) [4] er en associationsanalyse af et gen med en klar (forventet) biologisk relevans i forhold til den undersøgte problemstilling - for eksempel i forhold til en sygdoms patogenese. Der er således tale om en hypotesegenereret undersøgelse. Ved anvendelse af kandidatgen-associa-tionsstudier er der påvist en række sygdomsassocierede gener [5].

De seneste år har total genomskanninger (genome wide association studies, GWAS) med anvendelse af mere end en halv million genmarkører været mulige. GWAS har for nylig været beskrevet i Ugeskrift for Læger. Analysen er forudsætningsløs, dvs. den bygger ikke på en forud bestående hypotese som be- eller afkræftes. Pga. det store antal markører er der en vis statistisk sandsynlighed for, at nogle vil falde signifikant ud alene som følge at tilfældighed, hvorfor der korrigeres herfor via den statistiske analyse (Bonferonikorrektion). Analysens styrke kan øges ved at fokusere på særlige områder og øge markørtætheden, men især ved at øge antallet af undersøgte personer [6]. I praksis har det ofte vist sig nødvendigt at samle undersøgelsesmateriale fra flere populationer. Herved har studierne haft styrke til at detektere gener med små effekter på sygdomsrisici, som er fælles for flere populationer og dermed overordnet kan have en stor betydning for den samlede sygdomsbelastningen i samfundet. Studierne kan ses på hjemmesiden Published Genome Wide Association Studies [1]. Sådanne store studier og metaanalyser har ført til en eksplosion af nye identificerede loci og gener af betydning for type 1- og 2-diabetes, hjertekarsygdomme, reumatologiske sygdomme, kræftsygdomme, fedme og behandlingsrespons [1].

Er de arvelige sygdomsårsager nu kortlagt?

Påvisning af visse genetiske varianter har en høj prædiktiv værdi. For eksempel er BRCA1- og BRCA2-varianter associeret med en høj risiko for udvikling af kræft i æggestokkene og brystet. Denne viden har fået praktisk klinisk anvendelse, idet de berørte personer får tilbudt profylaktiske tiltag. Generelt er det dog kun muligt at forklare en lille del af den samlede genetisk betingede variation [5]. Således kan den genetiske risikoprofil kun i begrænset omfang forudsige risikoen for en specifik kompleks sygdom for det enkelte individ. Ligeledes kan observationerne kun forklare en lille del af forekomsten af en sygdom - med andre ord er andelen af hvor meget mindre forekomsten af den specifikke sygdom ville være i en -population uden det specifikke sygdomsallel (Popu-la-tion Attributable Fraction (PAF)) stadig meget lille. Det kan konkluderes, at mange gener med en lille risikomodificerende effekt må forventes at være årsag til en stor del af den genetisk betingede sygdomsrisiko.

Fra gen til patogenese

Selv om vi kun kan forklare en lille del af årsagen til de komplekse sygdomme, har denne viden haft kolossal betydning. Der er opnået store fremskridt i forståelsen af patogenetiske mekanismer. Som et eksempel kan nævnes, at den samme genetiske variant har kunnet identificeres ved flere forskellige sygdomme, som ikke hidtil har været forbundne. Det tyder på, at det genprodukt, som genet koder for, indgår i patogenesen af forskellige sygdomme - med andre ord at fælles biologiske stier kan være »ramt« ved flere forskellige sygdomme. Desuden har fundet af nye mulige angrebspunkter initieret udviklingen af nye lægemidler, der er baseret på rationelt lægemiddeldesign [7].

Det har imidlertid også vist sig uhyre kompliceret at omsætte et identificeret genlocus til en molekylær forståelse. Strategier kan omfatte forfinede genmarkøranalyser, sekvensanalyse, kloning og kandidatgen-associationsanalyser og efterfølgende allelekspressionsanalyser i cellelinjer, genetisk modulerede mus og overkrydningsundersøgelser på rotter og mus [8] i kombination med proteomics og genomics af celler og væv.

Diskussion

Studierne har samstemmende peget på hvor komplekse mekanismer, der indgår i patogenesen af mange almindelige sygdomme. For det første bidrager hvert gen kun med en lille risikoændring, og selv raske med en lav sygdomsrisiko vil besidde nogle risikogener [9]. Multiple gener og miljøfaktorer kan hver især disponere til eller beskytte mod udviklingen af en bestemt fænotype [9], og forskellige genotyper kan forventes at føre til den samme fænotype [10].

Store studier med bidrag fra flere populationer (totalgenom-associationsstudier) vil kunne identificere genmarkører med en effekt, der ligger tæt på eller under detektionsgrænsen for de hidtidige studier. I sagens natur vil disse studiers styrke være at identificere faktorer, der er fælles for de undersøgte populationer. Undersøgelser på velkarakteriserede populationer (kandidatgenanalyse) er derimod velegnede til at detektere »private« risikogener i heterogene populationer, dvs. varianter der er udtrykt forskelligt i forskellige populationer eller i befolkningsgrupper med forskelle i levevis og deraf følgende forskelle i eksposition.

Målet er at identificere biologisk relevante genotype-fænotype-relationer. Den øgede forståelse på det molekylære plan kan udnyttes til 1) bedre forståelse af sygdommes årsager og udvikling, 2) større diagnostisk sikkerhed, 3) bedre prognosticering og vurdering af behandlingsbehov, 4) individualiserede behandlingsregimer med bedre effekt og færre risici og bivirkninger, 6) rationelt lægemiddeldesign og 7) identifikation af subgrupper med behov for særlig behandling for at nævne nogle eksempler. Indtil nu har vi kun set toppen af isbjerget, og de gjorte erfaringer tyder på, at der kan opnås virkelig store fremskridt inden for sygdomsforståelse og -behandling. Det er en forudsætning for fortsatte fremskridt, at der anvendes multiple metoder og angrebsvinkler ved identifikation af genetiske og miljømæssige risikomarkører.

Vibeke Charlotte Andersen, Medicinsk Afdeling, Regionshospitalet Viborg, DK-8800 Viborg.

E-mail: Vibeke.andersen@viborg.rm.dk

Antaget: 22. maj 2009

Interessekonflikter: Ingen

Taksigelser: Tak til Jette Hansen, Ian McCulloch, Hanne Christensen, fagbiblioteket, samt Tina Bach, Informationsafdelingen, Regionshospitalet Viborg. Familien Erichsens Mindefond, A.P. Møller og Hustru Chastine Mc-Kinney Møller Fond til Lægevidenskabens Fremme og Region Midt takkes for økonomisk støtte.

Summary

Summary Genetic epidemiology Ugeskr Læger 2010;172(5):368-371 Both genetic and environmental factors contribute to the aetiology of many common diseases. Recently, progress has been made in the identification of susceptibility genes by candidate gene and genome-wide association studies. Thereby, a further molecular understanding of pathophysiological pathways has been obtained and the development of new therapeutic modalities based on rational drug design has been initiated. However, a host of methods and approaches are necessary to further increase the knowledge on the aetiology of the complex diseases.

Referencer

Hindorff LA, Junkins HA, Manolio TA. A catalog of published genome-wide association studies. www.genome.gov/26525384.Accessed.
McCarthy MI, Abecasis GR, Cardon LR et al. Genome-wide association studies for complex traits: consensus, uncertainty and challenges. Nat Rev Genet 2008;9:356-69.
International HapMap Project. www.hapmap.org/whatishapmap.html.
Daly AK. Candidate gene case-control studies. Pharmacogenomics 2003;4:127-39.
Wray NR, Goddard ME, Visscher PM. Prediction of individual genetic risk of complex disease. Curr Opin Genet Dev 2008;18:257-63.
Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature 2007;447:661-78.
Grant SF, Hakonarson H. Recent development in pharmacogenomics: from candidate genes to genome-wide association studies. Expert Rev Mol Diagn 2007;7:371-93.
Pomp D, Allan MF, Wesolowski SR. Quantitative genomics: exploring the gen-etic architecture of complex trait predisposition. J Anim Sci 2004;82 E-Suppl:E300-E312.
Janssens AC, van Duijn CM. Genome-based prediction of common diseases: advances and prospects. Hum Mol Genet 2008;17:R166-R173.
Zondervan KT, Cardon LR. Designing candidate gene and genome-wide case-control association studies. Nat Protoc 2007;2:2492-501.