Skip to main content

Kohorteundersøgelser for begyndere

Adjunkt Anne-Marie Nybo Andersen & lektor Merete Osler Københavns Universitet, Institut for Folkesundhedsvidenskab, Afdeling for Social Medicin

4. nov. 2005
12 min.


Ordet kohorte vil være velkendt af entusiastiske Asterixlæsere: Den romerske hær opdelte sine legioner i ti grupper, kohorter, hver på 300-600 soldater (Figur 1 ). Begrebet er senere blevet adopteret af den medicinske og demografiske verden. I A Dictionary of Epidemiology defineres en kohorteundersøgelse som »The analytic method of epidemiologic study in which subsets of a defined population can be identified who are, have been, or in the future may be exposed or not exposed, or exposed in different degrees, to a factor or factors hypothesized to influence the probability of occurrence of a given disease or other outcome. The main feature of cohort study is observation of large numbers over a long period with comparison of incidence rates in groups that differ in exposure levels.« [1].

Kohorteundersøgelser vil også kunne findes beskrevet som longitudinelle undersøgelser, followupundersøgelser, incidensstudier eller prospektive undersøgelser.

Kohortedesignet

Den epidemiologiske kohorteundersøgelse er altså karakteriseret ved at følge en veldefineret gruppe af mennesker over tid med henblik på at bestemme udviklingen af et eller flere helbredsfænomener. Det grundlæggende princip i kohorteundersøgelsen er at bestemme udviklingen i forekomsten af et helbredsfænomen blandt mennesker udsat for en bestemt påvirkning (eksposition) og sammenligne den med udviklingen i forekomsten af det samme helbredsfænomen blandt dem, der ikke var udsat for ekspositionen, med henblik på at undersøge ekspositionens betydning for udviklingen af det pågældende helbredsfænomen (outcome ).

Et andet karakteristikum ved kohortestudiet er, at det er observationelt. De fleste interventionsundersøgelser, f.eks. dobbeltblindede, kliniske forsøg med medikamenter, er karakteriseret ved at følge to eller flere grupper, der på en kontrolleret måde udsættes for ekspositioner (her medikamenter) og disse kunne, jævnfør den ovenstående definition, betegnes som kohorteundersøgelser. Imidlertid er begrebet kohorteundersøgelser reserveret til de observationelle design, hvor forskeren ikke intervenerer i deltagernes ekspositioner eller udsætter deltagerne for eksperimenter.

I kohorteundersøgelser er oplysningen om ekspositionsforhold altid indsamlet prospektivt, altså registreret førend personen får det helbredsfænomen, der studeres. Det gælder også, selv om data faktisk først indhentes af forskeren efter, at sygdommen er opstået.

Et eksempel kan illustrere dette: Man ønsker at studere en påstået sammenhæng mellem fødselsvægt og risiko for at få testikelkræft i et prospektivt design. Dette kunne gøres ved at registrere fødselsvægten for alle drenge, der bliver født i 2004, og følge dem i de næste 30 år for at se, hvem der får testikelkræft. Dataindsamlingen til dette projekt vil være afsluttet omkring 2034, hvorefter data kunne analyseres. Kun meget unge eller optimistiske forskere ville sætte et sådant projekt i gang, og man vil som oftest gerne kende svaret på forskningsspørgsmålet, før en relevant opfølgningstid er gået. Så en alternativ tilgang kunne være at identificere alle drenge, der er født i 1973, finde deres fødselsvægt, som ved fødslen blev indberettet til Det Medicinske Fødselsregister, og undersøge, om de i løbet af de følgende 30 år har fået testikelkræft. Som det ses er dette også en followupundersøgelse, der ikke principielt adskiller sig fra den første. Af og til anvendes begrebet historisk kohorteundersøgelse om dette design. Man kan i lærebøger også støde på begrebet ambidirektionel kohorte, hvilket skulle beskrive brug af historiske data såvel som ikke- historiske data: I det ovenstående eksempel kunne det være det sidstnævnte studie, som forskeren beslutter sig for at følge op med hensyn til risikoen for testikelkræft fra 30-års-alderen til 50-års-alderen, altså indtil 2024. Begreberne historisk kohorte og ambidirektionel kohorte tjener efter vores opfattelse ikke et højere formål end at forvirre læseren, for i sagens natur er tiden gået, og det studerede helbredsfænomen har manifesteret sig, når et projekt afrapporteres.

Mange mennesker vil intuitivt mene, at f.eks. interviewoplysninger fra ældre om forhold i barndommen er indsamlet retrospektivt. Det er de imidlertid ikke, hvis de anvendes til at studere helbredsforhold, der opstår, efter disse data er indsamlet. Hvis man tænker efter, vil man indse, at - næsten - alle oplysninger om eksposition omhandler fortiden, om end denne kan være nærmere eller fjernere. Begreberne prospektiv og retrospektiv bør efter vores mening reserveres til at beskrive tidspunktet for registrering af oplysninger om ekspositioner i forhold til tidspunktet for opståen af det studerede helbredsfænomen, ikke til at beskrive undersøgelsestyper. Vi vil derfor anbefale at man udelukkende bruger begreberne kohorteundersøgelse eller followupundersøgelse.

Data i kohortestudier

Næsten alle former for data kan anvendes til at belyse ekspositionsforhold og outcome i kohortestudier: Spørgeskemadata, data fra hospitalspraksis eller almen praksis-journaler, kliniske og parakliniske data og registerdata er anvendelige, og der kan ikke gives generelle retningslinjer for, om den ene slags data er bedre end den anden. Det skal understreges, at man ved afrapportering eller læsning og vurdering af kohortestudier skal være opmærksom på, hvorfra ekspositionsoplysningerne stammer, og hvilken kvalitet disse data må formodes at have. Er data indsamlet til formålet (ad hoc-data), eller stammer oplysningerne fra eksterne kilder, f.eks. data fra registre indsamlet med administrative formål? Og hvilke potentielle styrker og svagheder har disse data? Data indsamlet fra administrative registre har ofte den fordel, at de er helt uafhængige af forskeren og forskningsspørgsmålet, hvorfor ubevidste (eller bevidste) skævvridninger af data til formålet er mindre sandsynligt. Ulempen er, at sådanne data ofte ikke præcist beskriver den eksposition, man egentlig ønsker at undersøge. I eksemplet med fødselsvægt og testikelkræft er de tilgængelige oplysninger præcis dem, man ønsker, og de er derfor velegnede. Men man skal ikke være blind for muligheden af, at de tilgængelige data ofte er bestemmende for det forskningsspørgsmål, der stilles. De utallige undersøgelser, som findes om relationen mellem fødselsvægt og helbred i både dansk og udenlandsk litteratur, kunne meget vel skyldes, at fødselsvægt faktisk findes tilgængelig i masser af populationer [2].

Ofte er de tilgængelige ekspositionsdata proxymål for den påvirkning, man egentlig ønsker at studere. Og ofte har forskerne kun adgang til meget summariske oplysninger om ekspositioner på et eller få tidspunkter i personens liv. Hvis der findes omfattende oplysninger om ekspositioner, er det muligt at inddrage disse i analysen, således at m an tager højde for de næsten altid forekommende vekslende ekspositionsforhold hen over tid. I et studie af betydningen af feber i graviditeten for risikoen for abort og dødfødsel kunne man således for hver enkelt kvinde bestemme tilstedeværelsen af feber og dennes intensitet graviditetsuge for graviditetsuge, og dette blev anvendt som ekspositionsmål i analyserne [3]. For en grundig diskussion af ekspositionsmål i kohortestudier vil vi henvise til lærebøger, af hvilke Modern Epidemiology kan anbefales [4].

Også de anvendte data om det studerede helbredsmål, outcome -målet, må vurderes kritisk. Er outcome -målet klart defineret, og er metoderne til bestemmelse af outcome gennemskuelige og stringente? Det er også vigtigt, at metoderne til at indsamle oplysninger om outcome er ens i de forskellige ekspositionsgrupper. Men man må også vurdere, om det er tænkeligt, at en diagnose vil blive stillet oftere blandt mennesker, der har været udsat for det studerede helbredsfænomen. Dette er sjældent tilfældet, hvis man studerer »hårde« helbredsmål som f.eks. død eller cancerforekomst, mens det ofte er tilfældet, når man studerer subjektive symptomer, dårligt definerede sygdomme eller sygdomme, der har kendte risikofaktorer. Således vil gravide pædagoger formentlig oftere få stillet diagnosen parvovirus B19 end andre gravide kvinder i forbindelse med en sygdomsepisode, ganske enkelt fordi pædagogerne får taget de relevante serologiske test som følge af, at både læger og pædagoger er bevidste om erhvervsrisikoen.

Andre overvejelser ved fortolkning af kohortestudier

Der er nogle helt basale forudsætninger, som bør opfyldes i kohortestudier: Kun personer med risiko for at få det studerede helbredsfænomen bør inddrages i studiet. Og den ueksponerede og de(n) eksponerede grupper skal, fraset ekspositionen, være så identiske som muligt. Ideelt set bør forskerne i deres design af undersøgelsen have gjort, hvad de kunne for at sikre, at grupperne er sammenlignelige. Hvor man ikke har kunnet sikre dette, må man forsøge at tage højde for forskelle i andre ekspositioner i analysen, ved hjælp af stratificerede eller multivariate teknikker. Kontrol for en sådan konfounding er kun et plaster på såret, da antallet af variable, man kan kontrollere for, er begrænset.

Spørgsmålet om deltagelsesprocenten i kohortestudier er kilde til nogen debat. I deskriptive tværsnitsstudier er deltagelsesprocenten som regel afgørende for, om undersøgelsens formål kan opfyldes, men dette er kun sjældent tilfældet i analytiske kohorteundersøgelser. I en kohorteundersøgelse med en deltagelse på 30% af de inviterede sammenligner man eksponerede med ikkeeksponerede. Hvis de øvrige krav til data i kohorteundersøgelser er opfyldt, vil den fundne forskel i incidens af det pågældende helbredsfænomen skyldes den studerede eksposition. Man må dog overveje, om særligt stærke selektionsmekanismer kan påvirke generaliserbarheden af det fundne resultat.

Den største trussel mod kohortestudier er frafald, også betegnet loss of follow-up . Hvis frafaldet er helt ligeligt fordelt i forhold til eksponeringsstatus, vil det relative risikomål ikke blive påvirket. Men ofte er frafaldet afhængigt af eksponeringsstatus, enten fordi de eksponerede er særlig motiverede til at deltage i undersøgelsen og derfor har et mindre frafald end den ikkeeksponerede gruppe (som det kunne være tilfældet i f.eks. undersøgelser af veteraner fra Vietnam- og Golf-krigene), eller fordi de eksponerede er særlig svære at følge (som det f.eks. kan være tilfældet med børn af alkoholmisbrugende forældre).

Spørgsmål om bias og vurdering af kohortestudier er nærmere behandlet i [5], der kan anbefales til interesserede.

Associationsmål i kohorteundersøgelser

Kohortestudier muliggør, at man kan udregne risikoen for, at et givet helbredsfænomen opstår (også betegnet den kumulerede incidensproportion) og incidensraten af et helbredsfænomen, altså antal nye tilfælde pr. tidsenhed, i den undersøgte population. I de enkleste tilfælde udregnes risikoen for eller incidensraten af helbredsfænomenet i to delkohorter, nemlig den eksponerede delkohorte og den ikkeeksponerede delkohorte. Forholdet mellem risiko eller incidensrater i disse to delkohorter udtrykkes oftest som en relativ risiko, forkortet RR, og denne relative risiko skal altså forstås som risikoen for at få det pågældende helbredsfænomen, hvis man har været udsat for ekspositionen, i forhold til hvis man ikke har været udsat for ekspositionen. Der kan selvfølgelig også være flere delkohorter, hver især defineret ved et niveau af eksposition, og den relative risiko udregnes for hver delkohorte, som regel i forhold til den ikkeeksponerede delkohorte. Når resultaterne af kohortestudier rapporteres, bør de relative risici vises sammen med konfidensintervaller, fordi det giver en bedre mulighed for at vurdere resultaternes styrke.

Risikodifferensen er forskellen mellem de to incidensrater, og dette mål beskriver, hvor mange af sygdomstilfældene i kohorten der kan tilskrives den pågældende eksponering.

Styrker og svagheder ved kohortedesignet

Den ultimative fordel ved kohortestudiet er, at temporaliteten - rækkefølgen i tid - mellem eksposition og outcome er sikker. Dette i modsætning til tværsnitsundersøgelsen og case-kontrol-studiet, hvor man ikke kan være sikker på, om det studerede outcome er en konsekvens af ekspositionen eller omvendt. Derudover er designet velegnet til at studere helbredseffekter af sjældne eksponeringer, fordi man her kan tage udgangspunkt i lige netop eksponeringen ved definitionen af kohorten. Det har man f.eks. gjort med held i mange arbejdsmedicinske undersøgelser.

Designet er mindre velegnet til at studere sjældne helbredsfænomener, fordi det kræver meget store kohorter at få et tilstrækkeligt antal outcomes til at lave meningsfulde analyser. Når en kohorte en gang er etableret, kan den anvendes til at undersøge mange forskellige helbredsfænomener, et aspekt som kan opveje en anden af kohortedesignets svagheder, nemlig udgifterne til at følge store befolkningsgrupper over lang tid.

Kohortestudier, nu og i fremtiden

Nogle klassiske kohortestudier fra udlandet er the Framingham Heart Study, the British Physicians' Study og Nurses Health Study. I Danmark var man tidligt med og har bidraget med andre store kohortestudier. I Storbritannien har man de tre store fødselskohorter, bestående af alle børn født i den første uge af april i 1946, 1958 og 1970, som med jævne mellemrum bliver fulgt op, og til stadighed bidrager til, at væsentlig ny viden bliver produceret [6]. Inden for de seneste år er Danmarks hidtil største kohorte etableret, nemlig fødselskohorten Bedre Sundhed for Mor og Barn, der omfatter 100.000 børn født i årene 1996-2003 [7]. Denne kohorte har ifølge sagens natur ikke endnu kunnet levere data til udforskningen af de store folkesygdomme, men det er tanken, at kohorten skal følges livslangt, og at dette unikke datamateriale skal kunne anvendes til at udforske årsager til sygelighed i de næste mange år. Et af motiverne til at starte denne kohorte var den tiltagende evidens for, at kroniske sygdomme udvikles som en konsekvens af både genetisk konstitution og forskellige påvirkninger hen over livsforløbet fra det tidligste (måske intrauterine) liv, i barndommen, ungdommen, voksenalderen og alderdommen [8]. Denne måde at anskue sygdomsudvikling på, kaldet life-course -perspektivet, vil yderligere nødvendiggøre eksistensen og brugen af kohorteundersøgelser, som påbegyndes t idligt i livet og har gentagne registreringer af ekspositioner og gentagen og langvarig opfølgning af helbredsforhold hos deltagerne [9]. Vi har i Danmark helt unikke muligheder for at lave sådanne undersøgelser, takket være befolkningens vilje til at deltage i forskning, eksistensen af gode helbredsregistre og det forhold, at mulighederne for opfølgning af kohortedeltagerne er i særklasse internationalt på grund af vore gode befolkningsregistre. Af disse grunde er Danmark for nylig blevet betegnet som epidemiologernes paradis [10]. Resultater fra velgennemførte danske kohortestudier kan sandsynligvis bidrage til forbedring af helbredstilstanden i mange befolkninger verden over, ikke kun blandt epidemiologer.


Anne-Marie Nybo Andersen, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab, Københavns Universitet, Blegdamsvej 3, DK-2200 København N.

Antaget: 9. marts 2004

Interessekonflikter: Ingen angivet



Summary

Summary Cohort studies for beginners: an introduction to cohort design and basic concepts Ugeskr Læger 2004;166:1431-1434 The basic features of cohort study design are described. Cohort studies are characterised by observation of populations over time. The population in a cohort study should be well defined and described according to its exposure to an agent or process and the outcome of interest. The design should allow for the study of the association between the exposure and one or several outcomes, and for the calculation of incidence rates and relative risks. The most important sources of bias in cohort studies are differences between the exposed and unexposed groups, apart from the level of exposure, and lack of follow-up. The life-course perspective on disease aetiology makes well-designed, long-term cohort studies essential.

Referencer

  1. Last JM. A dictionary of epidemiology. 3 ed. New York: Oxford University Press, 1999.
  2. Wilcox AJ. On the importance - and the unimportance - of birthweight. Int J Epidemiol 2001;30:1233-41.
  3. Andersen AM, Vastrup P, Wohlfahrt J et al. Fever in pregnancy and risk of fetal death: a cohort study. Lancet 2002;360:1552-6.
  4. Rothman K, Greenland S. Cohort studies. I: Rothman K, Greenland S, eds. Modern epidemiology. Philadelphia: Lippincott, Williams & Wilkins, 1998: 79-91.
  5. Grimes DA, Schulz KF. Cohort studies: marching towards outcomes. Lancet 2002;359:341-5.
  6. Changing Britain, changing lives. London: University of London, Institute of Education, 2003.
  7. Olsen J, Melbye M, Olsen SF et al. The Danish National Birth Cohort - its background, structure and aim. Scand J Public Health 2001;29:300-7.
  8. A life course approach to chronic disease epidemiology: tracing the origins of ill health from early to adult life. New York: Oxford University Press, 1997.
  9. Susser E, Terry MB. A conception-to-death cohort. Lancet 2003;361:797-8.
  10. Kaiser J. Everything you wanted to know about children, for $2.7 billion. Science 2003;301:162-3.