I takt med at digitaliseringen har udvidet mulighederne for løbende dataopsamling og -analyse [1], er der i sundhedspolitiske debatter om ibrugtagning af nye lægemidler udtrykt forventning om, at »real-world evidence« (RWE) kan bidrage til optimering af alle trin i processen fra lægemiddeludvikling til regulatoriske godkendelser og løbende behandlingsbeslutninger [2, 3]. RWE henviser til analyser, der bygger på data fra andre kilder end traditionelle, randomiserede kontrollerede forsøg (RCT) [1, 4, 5].
Fakta
Hovedbudskaber
Begrebet RWE er imidlertid uklart defineret, og der mangler konsensus om, hvilke metodiske standarder RWE-analyser bør bygge på ved lægemiddelgodkendelse [6, 7]. Et skridt på vejen til at kvalificere brugen af RWE er at forstå, hvordan det relaterer sig til eksisterende viden om studiedesign. Formålet med denne artikel er at præcisere, hvad der forstås ved RWE samt kortlægge metodiske udfordringer og diskutere perspektiver for anvendelse af RWE ved lægemiddelgodkendelser.
HVAD ER REAL-WORLD EVIDENCE?
Fælles for definitionerne af RWE er, at de tager afsæt i datakilden, mens studiedesign ikke tillægges særlig betydning – ud over at data ikke må stamme fra traditionelle RCT (se f.eks. Det Europæiske Lægemiddelagentur (EMA)’s definition i Tabel 1). Begrebets betydning udvider sig dermed i takt med, at nye datakilder bliver til.
Nogle afgrænser RWE til kun at være baseret på data fra observationelle studiedesign [8-10]. Andre inkluderer også data fra andre eksperimentelle design end traditionelle RCT, såsom pragmatiske RCT [1, 4-6, 11]. Dermed slås mange forskellige typer data og studiedesign sammen under ét (Figur 1). Dette miks af forskellige typer datakilder og studiedesign vanskeliggør en kvalificeret diskussion af, hvornår kvaliteten af RWE er tilstrækkelig til at vurdere effekten af et lægemiddel.
REAL-WORLD EVIDENCE VED LÆGEMIDDELGODKENDELSE: METODISKE UDFORDRINGER
Det er ikke nyt at basere regulatoriske beslutninger om lægemidler på data, som stammer fra andre studier end traditionelle RCT. Registerstudier har længe været brugt til monitorering af bivirkninger ved markedsførte lægemidler [4, 8]. Det nye er, at RWE også benyttes til dokumentation af lægemidlers effektivitet.
Når RCT siden 1950’erne er blevet etableret som guldstandard for dokumentation af lægemiddeleffekter, og regulatoriske krav er modelleret over den standard, skyldes det, at designet minimerer tilfældig variation og systematiske fejl. Designet er dermed velegnet til sikring af, at dokumenterede effekter skyldes lægemidlet og ikke andre forhold, dvs. at effekten er kausal [1]. Men de fordele, som gør RCT velegnet til undersøgelse af kausale effekter, er også en udfordring: Den interne validitet (kausal troværdighed) opnås på bekostning af usikkerhed om ekstern validitet (generaliserbarhed) [6]. Det skyldes, at forsøgene foretages under mere kontrollerede forhold, end der er i klinisk praksis, og ofte inkluderer meget selekterede patientpopulationer [8]. Kritikken af det traditionelle RCT har givet anledning til to metodiske bevægelser, som mødes i RWE-debatten.
Første bevægelse: øget brug af observationelle studiedesign
I en række studier har man søgt at afklare, om analyser baseret på observationelle studier kan erstatte traditionelle RCT [8, 12, 13], men uden at nå entydige konklusioner [6, 8]. Det amerikanske lægemiddelagentur, the Food and Drug Administration (FDA) har for nylig igangsat undersøgelser for at sammenligne effektestimater opnået via traditionelle RCT med effektestimater fra observationelle studier af samme intervention [14].
De væsentligste metodeforbehold ved observationelle effektstudier er større risiko for confounding (dvs. at associationen mellem behandling og effekt kan forklares af andre variabler) og omvendt kausalitet (dvs. at patientens helbredsstatus har betydning for valg af behandling snarere end at behandlingen påvirker helbredsstatus) end i RCT [1, 8]. Begge dele skaber usikkerhed om, hvorvidt de observerede effekter skyldes behandlingen [2]. Der er udviklet forskellige teknikker til reduktion af risikoen for konfounding, f.eks. via matchning, hvor man statistisk danner en kontrolgruppe ved at matche på karakteristika, såsom alder og køn [15]. Dog kan man kun tage højde for kendte faktorer, som man har data på. F.eks. kan det være en udfordring at få data på sundhedsrelateret adfærd, såsom rygning, som kan påvirke effektmålingerne.
Anden bevægelse: pragmatiske randomiserede kontrollerede forsøg
Andre søger at videreudvikle det design, der siden 1960’erne er kaldt for pragmatiske RCT [6, 16-21]. Som i traditionelle RCT randomiseres patienter i pragmatiske RCT til forskellige behandlingstilbud. Men forsøgssituationen tilnærmes klinisk hverdagspraksis for at øge resultaternes generaliserbarhed og undersøge effekter for populationer, der sjældent repræsenteres i kliniske forsøg (f.eks. ældre, minoritetsgrupper og patienter med lav performancestatus) [6, 21]. Tilnærmelsen til klinisk hverdagspraksis sker bl.a. ved at eksklusionskriterierne minimeres [20], antallet af kontrolbesøg følger så vidt muligt gængs klinisk praksis [17, 18], outcomemål udvælges ud fra beslutningsrelevans (f.eks. undgås surrogatmål) [19], og patienter og investigatorer er ikke blindede [21]. Traditionelle RCT og pragmatiske RCT kan ses som yderpunkter på et kontinuum af forsøgsdesign, som i det ene yderpunkt er særligt velegnet til at undersøge efficacy (virkningsgrad under ideelle omstændigheder) og i det andet yderpunkt effectiveness (virkningsgrad i normal klinisk praksis).
Den væsentligste metodediskussion ved pragmatiske RCT handler om, hvor stor vægt den eksterne validitet kan tillægges uden at reducere den interne validitet så meget, at vurderingen af kausalitet bliver usikker [6]. Ved nye lægemidler er det vigtigt, at der først er skabt tiltro til, at den observerede effekt rent faktisk skyldes lægemidlet (efficacy), før det estimeres, hvilke virkninger, der kan forventes i klinisk hverdagspraksis (effectiveness). Pragmatiske RCT er ikke særligt velegnede til dokumentation af efficacy af nye lægemidler, men er derimod velegnede til undersøgelse af komparativ effektivitet og omkostningseffektivitet af sammenlignelige terapier for samme indikation [6].
Real-world evidence og datakvalitet
RWE bygger på datakilder, hvis primære formål ikke er at dokumentere effekt [1]. Brug af RWE kræver derfor nøje overvejelser om datakvalitet. Dertil kommer etiske overvejelser i forhold til sikring af anonymitet ved samkøring af mange forskellige datakilder [18].
Mindst tre forhold kan udfordre kvaliteten af real-world data (RWD): 1) Manglende datakomplethed: RWD skabes i en klinisk hverdag med dokumentations- og tidspres. Dette kan f.eks. medføre manglende data for effektmodifikatorer (f.eks. lægemiddeldosis eller sværhedsgrad af sygdom) og konfoundere (f.eks. rygestatus) [4, 5, 11]. 2) Lav detaljeringsgrad (granularitet): Præcise behandlingsindikationer registreres ikke altid (f.eks. oplysninger om biomarkører, genmutationer eller behandlingslinjer) [10, 11]. Dette vanskeliggør undersøgelse af differentierede effekter for specialiserede indikationer. 3) Manglende standardisering: Målemetoder og registreringspraksisser kan variere (f.eks. brug af MedCom-standarder, diagnostiske assays og skalaer for behandlingseffekt) [1, 11]. Dette vanskeliggør sammenligning af effekter over tid og mellem behandlingssteder. Behandlingskomplians er typisk lavere i klinisk hverdagspraksis end i kontrollerede forsøg. Dette vanskeliggør vurdering af efficacy (men ikke nødvendigvis af effectiveness).
DISKUSSION
RWE-debatten bidrager til at sætte fokus på aktuelle problemstillinger ved lægemiddelgodkendelse, hvor traditionelle RCT kommer til kort. Pga. den medicinsk-teknologiske udvikling vil disse problemstillinger forventeligt blive mere presserende fremover.
Nye lægemidler målrettes i stigende grad små patientgrupper (f.eks. lægemidler til sjældne sygdomme, targeteret behandling og farmakogenetiske produkter) [22, 23]. Dette vanskeliggør brugen af klassiske RCT, fordi dette design og den tilknyttede statistiske håndtering af usikkerhed bygger på en metodisk antagelse om, at de undersøgte populationer er forholdsvis store [4, 11]. Endvidere er klassiske RCT designet til at reducere interindividuel varians, fordi det opfattes som »støj«, der vanskeliggør identifikation af (gennemsnitlige) behandlingseffekter [2]. Dette kan reducere muligheder for at forstå, hvad der betinger variation i behandlingseffekter, hvilket er vigtigt ved udvikling af personlig medicin. Ved gen- eller (stam)celleterapi, der kun skal administreres én eller få gange i patientens livstid, men hvor der forventes langvarig eller livslang effekt, kræver vurdering af effektstørrelser og -varighed typisk længere opfølgningstid, end hvad der er praktisk og økonomisk håndterligt i traditionelle RCT [2]. Dertil kommer etiske problemstillinger ved placebokontrollerede forsøg, når der er væsentlige, umødte behandlingsbehov [4, 8].
Pragmatiske RCT afhjælper ikke udfordringen med små patientgrupper, herunder effektvurdering af personlig medicin. Tværtimod kan pragmatiske forsøg kræve flere deltagere for at vise effektforskelle end i traditionelle RCT [19, 20]. Der er ikke et klart metodisk svar på, hvordan effektstudier for små patientgrupper bør designes, men i praksis ses der eksempler på, at lægemidler til sjældne sygdomme med umødte behandlingsbehov godkendes til markedsføring eller anbefales til klinisk brug på basis af enarmede interventionsstudier, hvor kontrolarmen modelleres på baggrund af RWD. F.eks. bruges registerdata til at modellere effekter ved naturlig sygdomsprogression uden behandling eller ved klinisk standardbehandling [2] (Tabel 2). Der mangler regulatoriske retningslinjer for brugen af sådanne design ved lægemiddelgodkendelse [7]. Metodiske opmærksomhedspunkter inkluderer bl.a. risiko for overestimering af behandlingseffekt på grund af placeboeffekt [28] samt manglende mulighed for at tage højde for udvikling i standardbehandling ved brug af historiske kontrolgrupper [10].
Som led i ambitioner om at sikre hurtigere bioteknologisk innovation godkendes en del lægemidler via fast track-processer i EMA og FDA med krav om postmarketingeffektmonitorering [2, 22, 23]. Dette indebærer, at den kliniske effektivitet (og evt. omkostningseffektivitet) følges op på baggrund af prospektive observationsstudier med de udfordringer, det skaber for intern validitet. For lægemiddelproducenterne kan tiden på markedet med patent øges, hvis lægemiddelmyndighederne accepterer kortere opfølgningstid i kliniske forsøg betinget af postmarketingeffektmonitorering. For regionerne og hospitalsafdelingerne kan det imidlertid blive ressourcetungt, hvis dataindsamlingen skal foregå inden for den daglige sygehusdrift. Tendensen mod betinget godkendelse af lægemidler kalder derfor på opmærksomhed om mulig cost shifting, dvs. at en del af dokumentationsbyrden flyttes fra lægemiddelvirksomhederne til det offentligt finansierede sundhedsvæsen. Problemer med cost shifting kan f.eks. imødegås ved, at flytningen af dokumentationsbyrden afspejles i prisen for lægemidlet, f.eks. via risikodelingsaftaler, omend der er begrænset international erfaring med den praktiske håndtering heraf.
Opsummering
RWE-debatten revitaliserer klassiske metodediskussioner og skaber fokus på nye muligheder for at integrere dataopsamling i den kliniske hverdag samt understøtte databaseret analyse og beslutningstagning. Ulempen ved RWE-begrebet er imidlertid, at det sammenlægger en række undersøgelsesdesign, som der findes et velbeskrevet begrebsapparat til at skelne imellem. Risikoen er, at vigtige metodiske distinktioner bliver overset i begejstringen over nye datakilder. Hvis RWE-debatten skal føre til nye dokumentationsstandarder, som kan give relevant beslutningsstøtte for lægemiddelproducenter, klinikere og administrative beslutningstagere i konkrete – og ofte komplekse – afgørelser, er der behov for mere præcis terminologi og metodiske overvejelser, hvad angår studiedesign og datakvalitet. I europæisk regi arbejdes der bl.a. med metodiske problemstillinger ved brug af pragmatiske RCT i GetReal-initiativet, hvor universitetsforskere, patientforeninger, forskende lægemiddelvirksomheder og health technology assessment-institutioner er repræsenteret. Der er tilsvarende behov for metodisk udvikling i andre typer studiedesign.
KORRESPONDANCE: Sarah Wadmann. E-mail: sawa@vive.dk
ANTAGET: 26. juni 2020
PUBLICERET PÅ UGESKRIFTET.DK: 17. august 2020
INTERESSEKONFLIKTER: Forfatternes ICMJE-formularer er tilgængelig sammen med artiklen på Ugeskriftet.dk
LITTERATUR: Findes i artiklen publiceret på Ugeskriftet.dk
Summary
Use of real-world evidence in regulatory drug approval
Sarah Wadmann & Betina Højgaard
Ugeskr Læger 2020;182:V02200091
Real-world evidence (RWE) is gaining traction in political and scientific debate. The RWE debate revitalises discussions about causal inference by challenging the randomised controlled trial as a gold standard for demonstrating drug efficacy and effectiveness. This article outlines methodological challenges and possibilities for using RWE in regulatory drug approval. We argue, that more precise terminology and methodological considerations about study designs and data quality is needed, if the RWE debate is to inform new standards for evidence-based decision-making.
Referencer
Litteratur
Sherman RE, Anderson SA, Pan GJD et al. Real-world evidence – what is it and what can it tell us? New Engl J Med 2016;375:2293-7.
Eichler H, Bloechl-Daum B, Broich K et al. Data rich, information poor: can we use electronic health records to create a learning healthcare system for pharmaceuticals? Clin Pharmacol Ther 2019;105:912-22.
The European Federation of Pharmaceuticals Industries and Associations (EFPIA). GetReal Initiative. Innovative medicines initiative. https://www.imi.europa.eu/projects-results/project-factsheets/getreal-initiative (11. feb 2020).
Cave A, Kurz X, Arlett P. Real-world data for regulatory decision making: challenges and possible solutions for Europe. Clin Pharmacol Ther 2019;106:36-9.
Garrison LP, Neumann PJ, Erickson P et al. Using real-world data for coverage and payment decisions: The ISPOR Real-World Data Task Force Report. Value Health 2007;10:326-35.
Zuidgeest MGP, Goetz I, Groenworld RHH et al. Series: Pragmatic trials and real world evidence: Paper 1. Introduction. J Clin Epidemiol 2017;88:7-13.
Dreyer NA. Advancing a framework for regulatory use of real-world evidence: when real is reliable. Ther Innov Regul Sci 2018;52:362-8.
Franklin JM, Schneeweiss S. When and how can real world data analyses substitute for randomized controlled trials. Clin Pharmacol Ther 2017;102:924-33.
Berger ML, Sox H, Willke RJ et al. Good practices for real-world data studies of treatment and/or comparative effectiveness: recommendations from the joint ISPOR-ISPE Special Task Force on real-world evidence in health care decision making. Pharmacoepidemiol Drug Saf 2017;26:1033-9.
Beaulieu-Jones BK, Finlayson SG, Yuan W et al. Examining the use of real-world evidence in the regulatory process. Clin Pharmacol Ther 2020;107:843-52.
Agarwala V, Khozin S, Singal G et al. Real-world evidence in support of precision medicine: clinico-genomic cancer data as a case study. Health Affairs 2018;37:765-72.
Anglemyer A, Horvath HT, Bevo L. Helathcare outcomes assessed with observational study designs compared with those assessed in randomized trials. Cochrane Database Syst Rev 2014;4:MR000034.
Hemkens LG, Contopoulos-Ioannidis DG, Ioannidis JP. Agreement of treatment effects of mortality from routinely collected data and subsequent randomized trials: meta-epidemiological survey. BMJ 2016;352:i493.
Corrigan-Curay J, Sacks L, Woodcock J. Real-world evidence and real-world data for evaluating drug safety and effectiveness. JAMA 2018;320:867-8.
Stuart EA, Rubin DB. Best practices in quasi-experimental designs. I: Osborne J, red. Practices in quantitative methods. SAGE Publication, 2008:155-76.
Schwartz D, Lellouch J. Explanatory and pragmatic attitudes in therapeutical trials. J Chronic Dis 1967;20:637-48.
Irving E, van der Bor R, Welsing P et al. Series: pragmatic trials and real world evidence: Paper 7. Safet, quality and monitoring. J Clin Epidemiol 2017;91:6-12.
Meinecke A, Welsing P, Kafatos G et al. Series: pragmatic trials and real world evidence: Paper 8. Data collection and management. J Clin Epidemiol 2017;91:13-22.
Welsing PM, Rengerink KO, Collier S et al. Series: pragmatic trials and real world evidence: Paper 6. Outcome measures in teh real world. J Clin Epidemiol 2017;90:99-107.
Rengerink KO, Kalkman S, Collier S et al. Series: pragmatic trials and real world evidence: Paper 3. Patient selection challenges and consequences. J Clin Epidemiol 2017;89:173-80.
Dal-Ré R, Janiaud P, Loannidis JPA. Real-world evidence: how pragmatic are randomized controlled trials labeled as pragmatic? BMC Med 2018;16:49.
Darrow JJ, Avorn J, Kesselheim AS. FDA approval and regulation of pharmaceuticals, 1983-2018. JAMA 2020;323:164-76.
Goring S, Taylor A, Müller K, Li TJJ, Korol EE, Levy AR, et al. Characteristics of non-randomised studies using comparisons with external controls submitted for regulatory approval in the USA and Europe: a systematic review. BMJ Open 2019.
European Medicines Agency. Yescarta. 03/02/2020. https://www.ema.europa.eu/en/medicines/human/EPAR/yescarta (11. feb 2020).
Medicinrådet. Tisagenlecleucel (kymriah) – akut lymfatisk leukæmi. https://medicinraadet.dk/anbefalinger-og-vejledninger/anbefalinger-nye-laegemidler-og-indikationsudvidelser/o-u-anbefalinger/tisagenlecleucel-kymriah-akut-lymfatisk-leukaemi (11. feb 2020).
European Medicines Agency. Spinraza. 19/09/2019. https://www.ema.europa.eu/en/medicines/human/EPAR/spinraza (11. feb 2020).
Medicinrådet. Nusinersen (Spinraza). https://medicinraadet.dk/anbefalinger-og-vejledninger/anbefalinger-nye-laegemidler-og-indikationsudvidelser/h-n-anbefalinger/nusinersen-spinraza-revurdering (11. feb 2020).
Evans SR. Clinical trial structures. J Exp Stroke Transl Med 2010;3:8-18.