Skip to main content

Retrospektive og prospektive studiedesign

Cover

Søren Korsgaard1 & Morten Schmidt1, 2

8. apr. 2024
10 min.

Hovedbudskaber

Artiklens vigtigste nye budskaber

Begreberne »retrospektivt« og »prospektivt« var oprindeligt tiltænkt som etiketter, der skulle bidrage til en kortfattet opsummering af kliniske og epidemiologiske studiers metode [1]. Dog har begreberne givet anledning til megen forvirring. Dette skyldes, at der historisk er blevet introduceret tre forskellige begrebsdefinitioner, uden at der er blevet etableret konsensus om anvendelsen af én af disse. Hvad der tolkes om et studies metode ud fra etiketterne »retrospektivt« og »prospektivt« er således varierende og ofte ikketransparent.

Selv om der i epidemiologiske kredse er generel enighed om, hvilken definition der metodologisk er mest korrekt, synes begrebsforvirringen i den bredere, medicinske litteratur ikke bedret over de seneste 30 år [1]. Emnet er derfor fortsat højaktuelt, da der ikke blot er tale om en semantisk diskussion: Begreberne bærer tilhørende konnotationer, hvor begrebet »retrospektivt« i alle de tre definitioner indikerer en metodisk underlegenhed [2].

Denne statusartikel opsummerer og evaluerer derfor de forskellige definitioner af begreberne »retrospektivt« og »prospektivt«.

BEGREBSDEFINITIONER

Der har historisk set været tre definitioner af begreberne »retrospektivt« og »prospektivt« med rødder i forskellige epidemiologiske skoler (Figur 1 og Tabel 1).

Første begrebsdefinition

I den første begrebsdefinition (»Sir Bradford Hill« og »Johns Hopkins-skolen«) benyttes begreberne synonymt med specifikke studiedesign: »retrospektivt« om case-kontrol-studier og »prospektivt« om kohortestudier [1-4].

Anden begrebsdefinition

I den anden definition (»Harvard-skolen«) er det centrale den tidsmæssige relation mellem beslutningen om at iværksætte studiet og selve dataindsamlingen [1, 2, 5]. Prospektive studier er her studier, hvor eksponeringsinformationer bliver indsamlet med et specifikt sygdomsudfald for øje. Deltagerne følges derefter fremad i tid, og forskeren »ældes« så at sige med studiedeltagerne. Retrospektive studier er derimod studier, der benytter sig af data, som allerede er indsamlet på det tidspunkt, studiet iværksættes. En alternativ formulering er, at i prospektive studier akkumuleres studiedeltagernes risikotid efter studiets start, mens risikotiden allerede er akkumuleret i retrospektive studier. Denne begrebsdefinition ses også benyttet i introduktionslærebøger i epidemiologi [6, 7].

Tredje begrebsdefinition

I den tredje begrebsdefinition (»Modern Epidemiology-skolen«) lægges der vægt på den tidsmæssige relation til den faktiske dataindsamling [2, 5]. Hvis eksponeringsinformationer blev indhentet, efter udfaldet indtrådte, kaldes dataindsamlingen for retrospektiv. Hvis eksponeringsinformationer blev indhentet, før udfaldet indtrådte, kaldes dataindsamlingen for prospektiv. Om risikotiden allerede er akkumuleret på tidspunktet for studiets planlægning er irrelevant i denne sammenhæng. Denne definition anbefales i mere avancerede, epidemiologiske lærebøger [2].

BEGREBSFORVIRRING

I Tabel 2 præsenteres fem eksempler på studiedesign og deres klassifikation som »retrospektive« eller »prospektive«, afhængigt af den valgte begrebsdefinition.

Hvis man anvender den første begrebsdefinition, vil studie A og B klassificeres som værende retrospektive, mens studie C–E klassificeres som værende prospektive. Benyttes den anden begrebsdefinition, vil studie A, B, C og E klassificeres som værende retrospektive, mens kun studie D klassificeres som værende prospektivt. Studie D og E tjener til at illustrere, at studier, der benytter data indsamlet i befolkningsundersøgelser, principielt kun opfylder den anden begrebsdefinitions kriterier for at være et prospektivt studie, hvis disse data benyttes til at besvare et af de studiespørgsmål, der oprindeligt var for øje, da data blev indsamlet [1]. Tilhængere af denne skole vil desuden muligvis anfægte, at begreberne oprindeligt primært blev benyttet til at sondre mellem de forskellige typer af observationelle kohortestudier (studie C–E), mens case-kontrol-studier blev opfattet som noget separat [1]. Jævnfør den tredje begrebsdefinition vil studie A klassificeres som værende retrospektivt, mens studie B–E er prospektive. Hvis man anvender denne begrebsdefinition, vil en differentiering mellem studie C og D kunne realiseres ved at benævne studie C et historisk kohortestudie, hvormed brugen af allerede indsamlede data – deraf historiske – betones.

Bemærk, at selv om det randomiserede, kliniske studie er en underkategori af kohortestudier, er det ikke medtaget i Tabel 2. Ikke sjældent ses etiketten »Prospective randomised clinical trial«. Patienter kan dog ikke randomiseres i fortiden, hvorfor et randomiseret studie ikke kan være andet end prospektivt (uanset begrebsdefinition). Etiketten »prospektiv« er derfor i trial-sammenhæng overflødig og bør undgås.

METODOLOGISK EVALUERING

Til begreberne er der ofte tilknyttet konnotationer om studiekvalitet: Retrospektive studier anses pr. definition som værende af lavere kvalitet end prospektive studier [2]. Spørgsmålet er, om hver af de tre definitioner fortsat retfærdiggør sådanne konnotationer i dag? For at belyse dette spørgsmål diskuteres nedenfor de metodiske problemstillinger, som begrebet »retrospektivt« associerer til for hver af de tre begrebsdefinitioner (Tabel 1).

Første begrebsdefinition

Den første begrebsdefinition sidestiller case-kontrol-studier med retrospektive studier og kohortestudier med prospektive studier. Herved kategoriseres case-kontrol-studier implicit som underlegne i forhold til kohortestudier. Det er dog vigtigt at være opmærksom på den metodiske udvikling, som case-kontrol-studier har undergået over tid.

Det hyppigst benyttede case-kontrol-studie-design i en dansk kontekst i dag er case-density med risk-set (eller incidence density) sampling. Risk-set sampling betyder, at på det tidspunkt, hvor én case opstår, samples et givet antal kontroller fra populationen, der fortsat er i risiko for endepunktet. Denne elegante samplingsform medfører, at oddsratioen fra veludførte case-density-studier bliver et unbiased estimat af incidensrateratioen [2]. Veludførte case-kontrol-studier kan derfor i princippet estimere lige så valide relative estimater som kohortestudier [8]. Desuden kan et case-kontrol-studie være et validt og effektivt design, når udfaldet er sjældent, man undersøger mange forskellige eksponeringer eller ønsker effektiv ressourceudnyttelse af biologisk materiale [9]. Den forsimplede hierarkisering af case-kontrol-studier som noget underlegent relativt til kohortestudier er således misvisende [2].

Anden begrebsdefinition

Med den anden begrebsdefinition insinueres, at der i kohortestudier, hvor risikotiden er akkumuleret ved studiets igangsætning (retrospektivt), forekommer en række metodeproblemer, som ikke findes ved kohortestudier, hvor risikotiden akkumuleres i fremtiden (prospektivt). Anvendes f.eks. sekundære data (indsamlet til et andet formål end forskning [10]), er det da også afgørende at være opmærksom på centrale udfordringer vedrørende komplethed, detaljegrad og validitet af data i det pågældende register [10-12]. Men i hvilken grad, disse udfordringer er problematiske, afhænger helt af forholdet mellem det pågældende studiespørgsmål og de anvendte datakilder og må nøje vurderes i det enkelte tilfælde.

I en dansk kontekst er det muligt via CPR-nummeret i et vist omfang at begrænse problemstillingen med manglende information om vigtige variabler ved at kombinere oplysninger fra mange forskellige registre og spørgeskemaundersøgelser. Således kan man potentielt etablere et stort datasæt med detaljerede informationer om sygdomme og procedurer (f.eks. fra kliniske kvalitetsdatabaser, Cancerregisteret og Landspatientregisteret), receptpligtig medicin, blod- og vævsprøver, livsstilsfaktorer samt socioøkonomiske karakteristika [13]. En kohorte baseret på sådanne »historiske« data er således ikke implicit underlegen i forhold til en kohorte, hvor risikotiden akkumuleres i fremtiden, fordi sidstnævnte kohorte også kan have begrænsninger i størrelse, omfang af de indsamlede data samt ikke mindst komplethed af opfølgning.

Tredje begrebsdefinition

Jævnfør den tredje begrebsdefinition er den helt centrale begrænsning ved retrospektiv dataindsamling risikoen for differentieret misklassifikation af eksponeringen – en form for informationsbias, der også er kendt som recall bias [2]. Bekymringen er, om patienter erindrer deres eksponeringshistorik mere eller mindre akkurat, afhængigt af hvorvidt de har oplevet udfaldet eller ej. Tilsvarende kan opstå, når sundhedspersonale skal vurdere subjektive eksponeringsforhold og er bevidste om, hvorvidt udfaldet er indtrådt eller ej. En sådan differentieret misklassifikation af eksponeringen er særligt bekymrende, eftersom det kan føre til en falsk overestimering (falsk forøget risiko eller falsk beskyttende effekt) af de relative associationsmål mellem eksponering og udfald. Recall bias er klassisk en bekymring i visse case-kontrol-studier (som f.eks. studie A i Tabel 2), men det er en udbredt misforståelse, at det ofte forekommer i case-kontrol-studier. Tværtimod er det et yderst sjældent problem, som i praksis ikke er en bekymring i danske registerbaserede studier, hvor dataindsamlingen sker fortløbende (prospektivt) og derved ikke kan afhænge af fremtidige udfald. Ikke desto mindre er det en potentiel, metodologisk svaghed, hvis data er indsamlet retrospektivt, som retmæssigt kan give anledning til stor bekymring.

DISKUSSION

Begreberne »retrospektivt« og »prospektivt« har historisk set således været underlagt tre forskellige begrebsdefinitioner, som hver især betoner tre forskellige, metodiske problematikker ved retrospektive studier, hvilket har dannet grundlag for en vis begrebsforvirring. Undertiden kan man fortsat se alle tre begrebsdefinitioner anvendt, men dog synes den anden og tredje begrebsdefinition mest udbredt.

Mens den første og anden begrebsdefinition tidligere havde relevans, har udviklingen inden for studiedesign (første begrebsdefinition) og datakilder (anden begrebsdefinition) gjort det unuanceret at diskreditere studier per se udelukkende baseret på etiketten »retrospektivt«. Pointen i den første begrebsdefinition angives mere præcist med det specifikke studiedesign. Ønskes en betoning af, at man benytter allerede indsamlede data (anden begrebsdefinition), kan begrebet historisk tilføjes (historisk kohortestudie) – om end det metodologisk ikke bidrager med særligt brugbar information. Kun den tredje definition adresserer én konkret, potentielt metodisk svaghed (recall bias), der eksklusivt ses ved retrospektiv dataindsamling.

Det er således uhensigtsmæssigt at operere med overordnede etiketter til studedesign, der kan dække over flere og overlappende design, afhængigt af hvilken definition der underliggende refereres til. Guidelines for observationelle studier (Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)) har derfor også foreslået helt at undlade brugen af etiketterne »retrospektivt« og »prospektivt« [14].

KONKLUSION

Det anbefales at undlade brugen af begreberne »retrospektivt« og »prospektivt« som etiketter til studiedesign, eftersom disse begreber ofte er misvisende eller fejlfortolkes. Etiketten »retrospektivt« bør især ikke bruges som en bekymringsparaply for observationelle studier generelt. I stedet bør man altid forholde sig konkret til, i hvilket omfang det pågældende studies interne validitet kan være begrænset af systematiske fejlkilder (selektionsbias, informationsbias og konfounding) og statistisk usikkerhed. Der kan således for alle observationelle studier være mange grunde til at være kritisk, men at det skyldes metodologiske problemer relateret til retrospektivt studiedesign vil sjældent være årsagen. Ønsker man imidlertid at benytte begreberne, bør den tredje begrebsdefinition anvendes, da dette er den eneste definition, der betoner en konkret, metodisk begrænsning ved retrospektiv dataindsamling, som kan lede til betydelig bias og ikke kan forekomme ved prospektiv dataindsamling.

Korrespondance Søren Korsgaard. E-mail: soren.korsgaard@clin.au.dk

Antaget 7. februar 2024

Publiceret på ugeskriftet.dk 8. april 2024

Interessekonflikter Der er anført potentielle interessekonflikter. Forfatternes ICMJE-formularer er tilgængelige sammen med artiklen på ugeskriftet.dk

Referencer findes i artiklen publiceret på ugeskriftet.dk

Artikelreference Ugeskr Læger 2024;186:V12230789.

doi 10.61409/V12230789

Open Access under Creative Commons License CC BY-NC-ND 4.0

Summary

Retrospective and prospective study designs

The labels “retrospective” and “prospective” strongly connote study quality, often favouring prospective studies. However, three definitions of these terms exist, each suggesting distinct methodological limitations. In this review, we summarize and evaluate these definitions. Caution is warranted when labeling a study “retrospective”: This label should only be used when implying a risk of recall bias, which can only occur in retrospective data collection. Generally, assessing random and systematic errors is necessary to appraise study quality rather than relying on ambiguous labels.

Referencer

  1. Vandenbroucke JP. Prospective or retrospective: what's in a name? BMJ. 1991;302(6771):249-50. doi: https://doi.org/10.1136/bmj.302.6771.249
  2. Lash TL, VanderWeele TJ, Haneuse S, Rothman KJ. Modern epidemiology. 4th ed. Wolters Kluwer, 2021.
  3. Doll R. Prospective or retrospective: what's in a name? BMJ. 1991;302(6775):528-9. Doi: https://doi.org/10.1136/bmj.302.6775.528-c
  4. Last JM. Prospective or retrospective: what's in a name? BMJ. 1991;302(6775):528-9. doi: https://doi.org/10.1136/bmj.302.6775.528-c
  5. Morabia A. Prospective or retrospective: what's in a name? BMJ. 1991;302(6775):528-9. Doi: https://doi.org/10.1136/bmj.302.6775.528-d
  6. Fletcher RH, Fletcher SW. Clinical epidemiology: The essentials. 4th ed. Lippincott Williams & Wilkins, 2005.
  7. Rothman KJ. Epidemiology: an introduction. 2nd ed. Oxford University Press, 2012.
  8. Rothman KJ. Six persistent research misconceptions. J Gen Intern Med. 2014;29(7):1060-4. doi: https://doi.org/10.1007/s11606-013-2755-z
  9. Dey T, Mukherjee A, Chakraborty S. A practical overview of case-control studies in clinical practice. Chest. 2020;158(1 suppl):S57-S64. doi: https://doi.org/10.1016/j.chest.2020.03.009
  10. Sorensen HT, Sabroe S, Olsen J. A framework for evaluation of secondary data sources for epidemiological research. Int J Epidemiol. 1996;25(2):435-42. doi: https://doi.org/10.1093/ije/25.2.435
  11. Sørensen HT, Baron J. Medical databases. I: Olsen J, Greene N, Saracci R, Trichopoulos D, red. Teaching epidemiology: a guide for teachers in epidemiology, public health and clinical medicine. 4th ed. Oxford University Press, 2010:475-89. Doi: https://doi.org/10.1093/acprof:oso/9780199685004.003.0026
  12. Sørensen ST, Kristensen FP, Troelsen FS et al. Health registries as research tools: a review of methodological key issues. Dan Med J. 2023;70:A12220796.
  13. Schmidt M, Schmidt SAJ, Adelborg K et al. The Danish health care system and epidemiological research: from health care contacts to database records. Clin Epidemiol. 2019;11:563-591. doi: https://doi.org/10.2147/CLEP.S179083
  14. Vandenbroucke JP, von Elm E, Altman DG et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration. Epidemiology. 2007;18(6):805-35. doi: https://doi.org/10.1097/EDE.0b013e3181577511