Statusartikel

DNA-»micro-arrays« (DNA-chips) anvendt i molekylær medicinsk forskning

Torben F. Ørntoft

2. nov. 2005

16 min.

Mikrochipteknologi og kortlægning af genomerne har medført DNA- micro-array -teknologien, hvor tusindvis af gener analyseres parallelt på en lille glasplade. Det store datamateriale, der fremkommer, kræver bioinformatisk analyse for at blive omsat til biologisk forståelige resultater. Der findes forskellige former for DNA- micro-arrays . Nogle, der anvendes til at måle genekspression, dvs. hvilke gener der er tændte, og hvilke der er slukkede, andre der bestemmer sekvenser i et gen og endelig micro-arrays , der kan fastslå variationen i arvemassen, såkaldte SNP ( single nucleotide polymorphisms ). Der gennemgås nogle anvendelsesmuligheder for DNA- arrays inden for studier af celler og inden for klassifikation af sygdomme. Specielt inden for klassifikation af kræftsygdomme synes der at være mulighed for et videnskabeligt gennembrud, idet man kan identificere patienter, der vil få et aggressivt sygdomsforløb.

Tre udviklinger igennem de seneste fem år har muliggjort væsentlige fremskridt inden for vor forståelse af sygdomme, kortlægningen af det humane genom, DNA micro-array -teknologien og udviklingen af bioinformatik.

Kortlægning af genomet er sket hurtigere end ventet, og takket været en stor indsats fra offentlige databaser i USA er det blevet tilgængeligt for forskere overalt. Vi kan i dag på et stort antal amerikanske, japanske og europæiske databaser vandre langs genomet og detektere ikke blot, hvor enkelte gener er beliggende, men også koble videre til databaser, der beskriver genernes variationer, deres mulige funktioner og deres udtryk i de normale væv og eventuelle betydning for forskellige sygdomme.

I en nyere udgivelse af tidskriftet Nature Genetics beskrives en lang række databaser, der alle er tilgængelige på internettet, og som dermed kan danne grundlag for videre forskning. Dette har medført, at man som forsker føler en global samhørighed og samtidig har et uendeligt stærkt værktøj, hvis grænser endnu ikke er udforskede til rådighed. Tidligere tiders tidskrævende laboratoriearbejde er nu ofte afløst af muligheden for at klone gener (identificere nye gener i arvemassen) »in silico«, hvilket betyder på pc'en, uden at man har rørt en pipette. Man kan få forståelse for geners struktur og funktion i forskellige sygdomssammenhænge uden at have berørt andet end tastaturet på skrivebordet.

Genomet er individuelt, men der er forståeligt nok et stort fællesskab imellem individer, når det drejer sig om vigtige gener, der er nødvendige for cellernes overlevelse. Dette gennemsnitlige genom findes i databaserne, men har visse mindre fejl, fordi det er baseret på analyse af specifikke individer - det må dog anses for at være meget tæt på en præcis beskrivelse af vor arvemasse, og det opdateres løbende.

Variationerne er nu indlejret i en speciel database, således at forskere, der beskæftiger sig med variationer, kan koncentrere sig om dette område. Vi forventer ca. 20 variationer pr. gen, hvilket kan lede til produktion af mindst 20 forskellige proteiner fra hvert gen i arvemassen. Dette forklarer på sin vis, hvorfor mennesker er forskellige - ikke blot i udseende, men også i f.eks. biokemiske parametre, som de måles på sygehusenes laboratorier. I alt er 24 individers genomer tilgængelige på internettet, hvoraf kan udledes, at variationen selvfølgelig er større end beskrevet i dag - bl.a. baseret på racemæssige forskelle.

Udviklingen i vor forståelse af genomet vokser dag for dag, hvilket leder til f.eks. det problem, at de artikler, der publiceres, i mange tilfælde er baserede på forældede informationer. Tiden fra udarbejdelse af manuskripter til publicering er simpelthen for lang. Visse tidsskrifter vælger at præ-publicere på internettet for at undgå denne forsinkelse, men dette kan på ingen måde kompensere for det enorme moment, der er i udviklingen i øjeblikket.

En afledt effekt af dette er, at man som forsker uundgåeligt føler sig ude af trit med udviklingen. Det er næsten umuligt at være opdateret på alle områder i dag, og kravet til den enkelte forsker om videnopdatering er næsten umuligt at indløse fuldt ud.

DNA-»micro-array«-teknologien

DNA-micro-array -teknologien er baseret på det simple princip, at man analyserer flere gener samtidig - ved siden af hinanden. En lignende adfærd har man haft i sygehuslaboratorier igennem mange år, idet man kan analysere mange patientprøver samtidig, baseret på f.eks. det såkaldte titerbakkeprincip, hvor en plastikbakke med 96 brønde bruges, når man skal måle et stort antal forskellige prøver. Med DNA-micro-arrays er der imidletid sket et kvantespring, forstået på den måde at man ikke analyserer 96 gener samtidig, men 400.000. Analogien til computerverdenen er nærliggende, når man tænker på de gamle 8086 processorer og bløde floppy discs sammenlignet med vore dages megakraftige pc'er. De laver de samme binære operationer - blot mange parallelt og meget hurtigere.

DNA-micro-arrays er baserede på en solid overflade f.eks. glas. Oven på dette anbringer man de gensekvenser, man gerne vil analysere. Gensekvenserne henter man fra internettet (unigene builds ) efter at have underkastet dem bioinformatisk analyse. Dette består f.eks. i anvendelse af matematiske algoritmer, der på basis af forskellige kriterier udvælger områder af gener, der er egnede til at identificere det pågældende gen. Man kan ikke bruge områder af gener, der ligner andre gener - da man således ikke vil kunne skelne imellem gener. Analogt kan man sige, at man ikke kan selektere biler efter en blå lakering. Men kombinerer man den blå lakering med tilstedeværelsen af en bestemt kølergrill, bestemte vinduesviskere, antallet af døre og vinduesarealet når man tæt på at beskrive en enkelt bilmodel. På samme vis har man opsat krav til gener, således at man føler sig meget sikker på, at man udvælger et relevant genområde til at repræsentere et gen. Algoritmerne er et neuralt netværk, der baseret på syv parametre udvælger specifikke genområder.

Disse genområder placeres på glasoverflader, så de kan interagere med molekyler med den komplementære sekvens. For at forstå dette skal man vide, at gener består af baser (nukleotider), og at disse parrer sig med bestemte baser. Har man således en basesekvens på en glasoverflade, kan denne binde sig til en komplementær sekvens og kun denne. Det te er den teoretiske baggrund bag DNA-micro-arrays . På den måde kan man opbygge en stor mængde af forskellige korte DNA-sekvenser på glasoverflader, som vil kunne binde til små specifikke sekvenser på alle de 30.000 gener, der formodes at være i vor arvemasse.

Dette anvendes i for eksempel ekspressions-arrays til analyse af, hvilke gener der afskrives i en given cellepopulation. Arvemassen består af DNA, der i de kodende områder afskriver RNA. Dette oversættes til protein, og dermed har vi de proteiner, der er nødvendige, for at en celle kan fungere, i alt ca. 100.000 forskellige proteiner, hvoraf nogle er ret ens. Vil man derfor vide, hvilke proteiner der gør sig gældende i en given celle, kan man nøjes med at analysere RNA i stedet for proteinerne. Man vil derfor - med tilstrækkeligt mange forskellige sekvenser kunne identificere hele arvemassens aktivitet. Hvilke gener er slukkede - hvilke er tændte på et givet tidspunkt i cellens liv?

Men hvorfor ikke analysere selve proteinerne parallelt?

Af den simple grund at det sidste stadig er for svært. DNA og RNA er opbygget at fire forskellige nukleotider, som er relativt lette at analysere. Proteiner er opbygget af næsten 30 forskellige aminosyrer, som, efter at de er koblet sammen, udsættes for en række modifikationer, der medfører, at to proteiner med ens aminosyresekvens kan opføre sig meget forskelligt. Man vælger således ofte at analysere RNA-molekylerne - hvilket kan gøres meget ensartet på micro-arrays . En disciplin kaldet proteomics arbejder på massiv parallelanalyse af proteiner - dette er endnu på udviklingsstadiet, om end udviklingen går hurtigt, og de første bud på protein-arrays er blevet lanceret.

Anvendelse af DNA-»micro-arrays« i praksis

Baseret på ovennævnte micro-array -princip har man udført indgående studier af ændringer i arvemassens udtryk ved forskellige cellulære tilstande. Man kan groft inddele dette i ændringer ved sygdomme, ændringer som følge af stimulation med fysiologiske stoffer og ændringer, der er forårsaget af lægemidler.

Hvad angår ændringer forårsaget af sygdomme, vil jeg anvende cancer i blæren som eksempel. Ved blærecancer sker der en massiv ændring af genudtrykket målt med micro-arrays (1, 2). Vi har indsamlet en lang række blæretumorer (>10.000 baseret på et projekt finansieret af Kræftens Bekæmpelse) og har dermed været i stand til at udvælge tumorer fra forskellige sygdomsforløb. Vi har analyseret overfladiske, godartede polypper, let invasive tumorer og ondartede muskelinvasive tumorer. Disse er meget forskellige, når man måler deres udtrykte gener. Dette kan udnyttes dels til at klassificere disse tumorer, dels til at fået indblik i, hvilke cellulære pathways der er overvægtede eller undervægtede i tumorceller på forskellige stadier af sygdommen. Vi fandt f.eks., at blæretumorer ved de tidlige stadier udtrykker en meget stor mængde transkriptionsfaktorer, og i de mellemliggende stadier skifter over til udtryk af gener, der stimulerer cellecyklus og immunsystemet samt genererer nye blodkar, så tumorcellerne kan få tilstrækkelig føde til at vokse videre. Dette har to vigtige konsekvenser - dels kan man nu klassificere tumorer baseret på deres genudtryk (2), dels kan man nu via forståelse af tumorprogressionens ændring i cellulære processer udvikle nye lægemidler.

I Fig. 1 ser man genændringer, der er fundet ved udviklingen af forskellige sygdomme. Andre studier baseres på stimulation af celler med interleukiner og binding af et kemikalium/lægemiddel til celleoverflader. Vi har selv bidraget til ny viden inden for kræftsygdomme (1-4), hæmatologiske sygdomme (5), diabetes (6-8), øjensygdomme (11) og nervesystemet (12). En oversigt over emnet kan læses i (13).

Bioinformatik

For at kunne klassificere tumorerne anvender vi bioinformatiske metoder. Disse er baseret på et matematisk grundlag, men indeholder herudover viden om biologiske forhold. I blærecancermaterialet som beskrevet ovenfor udvælger man blandt de mange tusinde gener, der undersøges, dem, der giver den størst mulige separation af sygdomme i forskellige undergrupper. Man kan på den måde inddele kendte sygdomme i nye molekylært forskellige undergrupper, der har hver sin specifikke genudtryksprofil. Man tilnærmer sig en individuel forståelse af sygdomme i modsætning til den mere generelle opfattelse af at sygdomme er ens.

Dette kan have stor betydning i fremtiden, idet vi alle har erfaret, at mennesker reagerer meget forskelligt på lægemidler. Nogle har stor effekt af disse, andre har mindre eller ingen effekt. Dette kan eksemplificeres med behandling af kræftsygdomme, hvor nogle opnår tumorsvind og helbredelse, hvorimod andre kun har bivirkningerne fra behandlingen.

En vision ved bioinformatisk behandling af ekspressionsdata er derfor at få en dybtgående viden om de forhold, der gør sig gældende hos den enkelte undergruppe af kræftsygdomme. Dette stiller store krav til materialet. Man skal have endog meget store vævsbanker for at kunne identificere en række patientundergrupper, hvoraf nogle forekommer meget hyppige - andre mere sjældent. En størrelsesorden i området 1.000 til flere tusinde patienter er ofte nødvendig.

Et meget brugt værktøj til identifikation af grupper af patienter eller gener, der ligner hinanden, er cluster- analyser, der baseret på vektormatematik identificerer gener eller patienter, der har en ensartet adfærd i et n-dimensionalt rum, hvor n er antallet af gener, der analyseres. Man kan således arbejde med 70-dimensionale rum og finde to tumorer ud af 300, som placerer sig ganske tæt i dette virtuelle rum. Eksempelvist kan cluster-analyser tvangfrit identificere kønnet hos mus baseret på ganske få gener, identificere grupper af mus, der har fået gener slået ud, identificere de forskellige stadier i en tumorsygdom og identificere, hvornår funktionelt beslægtede gener tændes i en sygdomsudvikling.

»Single nucleotide polymorphisms-arrays«

Et andet meget brugt område for DNA micro-arrays er inden for identifikation af variationer i arvemassen. Det er altså nu variationer i DNA-strengene, der analyseres, og ikke som beskrevet ovenfor variationer i mængden af RNA afskrevet fra denne. Der er så mange variationer i DNA-strengene, at man nødvendigvis må basere målinger af disse på metoder, der kan måle tusindvis af variationer parallelt. Her har de mange molekyler koblet til en glasoverflade en stor fordel, idet man skal bruge meget små mængder udgangsmateriale for at få et godt svar. I praksis opbygges arrays således, at man har en probe for hver eneste variation, man ønsker at undersøge i arvemassen. Disse områder opformeres derefter og analyseres parallelt.

Variationer i arvemassen kan give anledning til sygdom (mutationer), men disse er oftest relativt sjældne (nogle få pr. 1.000 indbyggere). Når de bliver mere almindelige (>1% af befolkningen har dem), vil de blive betegnet som polymorfier. Disse polymorfier kaldes for single nucleotide polymorphisms (SNP), når de kun findes på en enkelt position i arvemassen (14).

Oftest er sådanne variationer fuldstændigt uden betydning for funktionen af det gen, som de er beliggende inden i. I sjældne tilfælde betyder de ændringer i effektiviteten af det protein, de sidder i. De kan eksempelvist medføre nedsat omsætning af lægemidler, som det er beskrevet for variationer i acetyltransferaserne (15). Patienter, d er omsætter hurtigt, skal derfor have mere medicin; de, der omsætter langsommere, mindre medicin.

Inden for kræftforskning kan man udnytte variationer i arvemassen til at studere tab af genomiske områder (såkaldt LOH) i tumorceller. Vi har i et nyere arbejde vist, at man kan inddele blæretumorer i dem, der har en svær genomisk instabilitet, og dem, der er næsten fuldstændigt stabile (16). De meget ustabile havde tabt op til 25% af deres arvemasse og var muterede i det afgørende DNA-kvalitetssikringsprotein p53.

DNA-micro-arrays kan enten købes kommercielt eller fremstilles in house . Vi har anvendt begge dele og anvender en strategi, der går ud på at købe micro-arrays med meget høj densitet (i et samarbejde med et biotekfirma i Californien har vi analyseret 59.000 gener på en micro-array på 1,2 kvadratcentimeters størrelse) til udvælgelse af gener, der er informative om en given sygdom, efterfulgt af analyse af disse gener på en hjemmelavet micro-array (Fig. 2 ). Sidstnævnte kan derefter bruges til større kliniske studier uden at medføre økonomisk udtørring, idet de hjemmelavede arrays er væsentligt billigere end de kommercielt fremstillede, der koster cirka 5.000 kroner pr. styk.

En relativt lidt brugt array -type er sekventerings-arrays . Dette skyldes til dels, at disse indtil nu har haft svært ved at finde insertioner og deletioner, hvorimod de virker udmærket til detektion af baseudskiftninger (17).

Fremtiden

Vi forventer fremover at kunne opløse kendte sygdomme i mindre undergrupper, som enten kan få en skræddersyet behandling, som den tilbydes i dag - eller på længere sigt få udviklet skræddersyede behandlinger. Mange biotekfirmaer udvikler i dag lægemidler, der er baserede på enkeltmolekyler, og disse behandlinger vil ofte kræve, at man har underkastet sygdomsprocesserne hos det enkelte individ en kortlægning for at vide, om et specifikt molekyle/en specifik pathway er til stede (Fig. 3 ).

For at opnå en endnu større opløsningsevne vil vi i fremtiden anvende enkelte cellegrupper, der er udskåret fra vævssnit. På disse ganske få celler kan vi få informationer om, hvordan en tumor kommunikerer med de omliggende værtsceller. Vi ved i dag, at tumorceller udnytter de relativt uskyldige, omliggende, normale værtsceller til at producere f.eks. vævsopløsende molekyler (proteaser), der nedbryder bindevævet, således at tumorceller kan invadere værten. Disse processer vil blive kortlagt i detaljer i de kommende år og vil formentligt medføre udvikling af nye lægemidler, der kan stoppe kræftinvasion.

Netop testning af lægemidler er meget lovende baseret på micro-arrays . Man kan ved tilsætning af en ny lægemiddelkandidat til cellekulturer måle, hvorledes disse stoffer påvirker cellen. Når man har opnået en gunstig effekt, kan man videreudvikle lægemidlet. Dette kan efterfølgende afprøves på forsøgsdyr. I disse kan man tidligt afsløre, om et nyt lægemiddel har uheldige bivirkninger målt som aktivering af uhensigtsmæssige pathways .

Afslutningsvis må man konkludere, at DNA-micro-arrays er et fantastisk stærkt værktøj til at opnå viden om de ændringer, der sker i gennetværket i celler. Man kan ikke længere nøjes med at se effekter af sygdomme og lægemidler på enkelte pathways og enkelte molekyler, men må i fremtiden tænke inden for genomiske netværk, hvor mange afledede effekter er relativt uventede med den viden, vi har i dag.

Dette er en udfordring til bioinformatikken, som gerne skulle afdække de interrelationer, der gør sig gældende i cellernes netværk. Dette er vanskeligt, eftersom der er mange variable, der er i samspil samtidig. Og det er netop derfor den største udfordring, vi har i dag - før vi endeligt forstår sygdomsprocesserne på det molekylære plan.

Torben F. Ørntoft , Klinisk Biokemisk Afdeling, Skejby Sygehus, Århus Universitetshospital, DK-8200 Århus N.

Antaget den 28. januar 2003.

Aarhus Universitetshospital, Skejby Sygehus, Klinisk Biokemisk Afdeling.

Thykjaer T, Workman C, Kruhoffer M et al. Identification of gene expression patterns in superficial and invasive human bladder cancer. Cancer Res 2001;61:2492-9.
Dyrskjøt L, Thykjaer T, Kruhoffer M et al. Identifying distinct classes of bladder carcinoma using microarrays. Nat Genet 2003;33:90-6.
Liang G, Gonzales FA, Jones PA et al. Analysis of gene induction in human fibroblasts and bladder cancer cells exposed to the methylation inhibitor 5-aza-2'-deoxycytidine. Cancer Res 2002;62:961-6.
Birkenkamp-Demtroder K, Christensen LL, Olesen SH et al. Gene expression in colorectal cancer. Cancer Res 2002;62:4352-63.
Tarte K, de Vos J, Thykjaer T et al. Generation of polyclonal plasmablasts from peripheral blood B cells: a normal counterpart of malignant plasmablasts. Blood 2002;100:1113-22.
Cardozo AK, Heimberg H, Heremans Y et al. A comprehensive analysis of cytokine-induced and nuclear factor-kappa B-dependent genes in primary rat pancreatic beta-cells. J Biol Chem 2001;276:48879-86.
Cardozo AK, Kruhoffer M, Leeman R et al. Identification of novel cytokine-induced genes in pancreatic beta-cells by high-density oligonucleotide arrays.Diabetes. 2001;50:909-20.
Flamez D, Berger V, Kruhoffer M et al. Critical role for cataplerosis via citrate in glucose-regulated insulin release. Diabetes 2002;51:2018-24.
Van't Veer LJ, Dai H, van de Vijver MJ et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature 2002;415:530-6.
Zembutsu H, Ohnishi Y, Tsunoda T et al. Genome-wide cDNA Micro-array screening to correlate gene expression profiles with sensitivity of 85 human cancer xenografts to anticancer drugs. Cancer Res 2002;62:518-27.
Kennan A, Aherne A, Palfi A et al. Identification of an IMPDH1 mutation in autosomal dominant retinitis pigmentosa (RP10) revealed following comparative micro-array analysis of transcripts derived from

Summary

Summary DNA-micro-arrays used in molecular medical science. Ugeskr Læger 2003;165:786-90. Microchip technology and mapping of the human genome has led to the invention of DNA-micro-array technology. In that technology thousands of genes are analysed in parallel on a small glass surface. The very large data material that is generated requires bioinformatic analysis in order to be transformed to understandable biological results. There are different forms of DNA-micro-arrays. Some are used for measuring gene expression, i.e. which genes are turned on and which genes are turned off. Others are used for sequencing, and finally some are used for measuring single nucleotide polymorphisms (SNPs). Some application possibilities of the arrays within the area of cell biology and classification of diseases are presented. Especially within the area of classification of cancer diseases the technology is promising, and a scientific breakthrough could occur in the area of classification of very aggressive cancers.

Referencer

Thykjaer T, Workman C, Kruhoffer M et al. Identification of gene expression patterns in superficial and invasive human bladder cancer. Cancer Res 2001;61:2492-9.
Dyrskjøt L, Thykjaer T, Kruhoffer M et al. Identifying distinct classes of bladder carcinoma using microarrays. Nat Genet 2003;33:90-6.
Liang G, Gonzales FA, Jones PA et al. Analysis of gene induction in human fibroblasts and bladder cancer cells exposed to the methylation inhibitor 5-aza-2'-deoxycytidine. Cancer Res 2002;62:961-6.
Birkenkamp-Demtroder K, Christensen LL, Olesen SH et al. Gene expression in colorectal cancer. Cancer Res 2002;62:4352-63.
Tarte K, de Vos J, Thykjaer T et al. Generation of polyclonal plasmablasts from peripheral blood B cells: a normal counterpart of malignant plasmablasts. Blood 2002;100:1113-22.
Cardozo AK, Heimberg H, Heremans Y et al. A comprehensive analysis of cytokine-induced and nuclear factor-kappa B-dependent genes in primary rat pancreatic beta-cells. J Biol Chem 2001;276:48879-86.
Cardozo AK, Kruhoffer M, Leeman R et al. Identification of novel cytokine-induced genes in pancreatic beta-cells by high-density oligonucleotide arrays.Diabetes. 2001;50:909-20.
Flamez D, Berger V, Kruhoffer M et al. Critical role for cataplerosis via citrate in glucose-regulated insulin release. Diabetes 2002;51:2018-24.
Van't Veer LJ, Dai H, van de Vijver MJ et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature 2002;415:530-6.
Zembutsu H, Ohnishi Y, Tsunoda T et al. Genome-wide cDNA Micro-array screening to correlate gene expression profiles with sensitivity of 85 human cancer xenografts to anticancer drugs. Cancer Res 2002;62:518-27.
Kennan A, Aherne A, Palfi A et al. Identification of an IMPDH1 mutation in autosomal dominant retinitis pigmentosa (RP10) revealed following comparative micro-array analysis of transcripts derived from retinas of wild-type and Rho(-/-) mice. Hum Mol Genet 2002;11:547-57.
Wyttenbach A, Swartz J, Kita H et al. Polyglutamine expansions cause decreased CRE-mediated transcription and early gene expression changes prior to cell death in an inducible cell model of Huntington's disease. Hum Mol Genet 2001;10:1829-45.
Celis JE, Kruhoffer M, Gromova I et al. Gene expression profiling: monitoring transcription and translation products using DNA micro-arrays and proteomics. FEBS Lett 2000;480:2-16.
Wang DG, Fan JB, Siao CJ et al. Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in the human genome. Science 1998;280:1077-82.
Sekine A, Saito S, Iida A et al. Identification of single-nucleotide polymorphisms (SNPs) of human N-acetyltransferase genes NAT1, NAT2, AANAT, ARD1 and L1CAM in the Japanese population. J Hum Genet 2001; 46:314-9.
Primdahl H, Wikman FP, von der Maase H et al. Allelic imbalances in human bladder cancer: genome-wide detection with high-density single-nucleotide polymorphism arrays. J Natl Cancer Inst 2002;94:216-23.
Wikman FP, Lu ML, Thykjaer T et al. Evaluation of the performance of a p53 sequencing micro-array chip using 140 previously sequenced bladder tumor. Clin Chem 2000;46:1555-61.