Skip to main content

Nye biostatistiske metoder i almen medicinsk forskning

Cand.scient. Henrik Støvring

2. nov. 2005
12 min.


Efterhånden som det almen medicinske forskningsfelt har udviklet sig mere selvstændigt, er området blevet genstand for øget interesse fra biostatistisk side. I artiklen gives et overblik over den statistisk metodologiske forskning med afsæt i almen medicinske problemstillinger vha. et litteraturstudie i de to biostatistiske tidsskrifter, Statistics in Medicine og Biometrics. Et centralt emne viser sig at være den såkaldte cluster -effekt, som derfor introduceres og diskuteres mere udførligt i artiklen. Til sidst præsenteres en litteraturgennemgang af 2001-årgangen af British Medical Journal og Scandinavian Journal of Primary Health Care. Det konkluderes, at den statistiske forskningsindsats har sat sig spor i den nyeste almen medicinske litteratur, men at metoderne til håndtering af en eventuel cluster -effekt endnu ikke har nået fuld udbredelse.

Det almen medicinske forskningsområde har først inden for de seneste 20-30 år fået en egen selvstændig profil, hvor feltet ikke blot er defineret som fravær af specialisering. Som ethvert andet videnskabeligt felt, hvor kvantitative undersøgelser har interesse, har også det almen medicinske felt adopteret mange statistiske metoder og redskaber. Efterhånden er den gensidige interesse vokset: Det almen medicinske område udgøres ikke længere blot af post hoc-analyser, men statistiske overvejelser (og biostatistikere) inddrages også i stigende grad i forsøgsplanlægningen. Fra den biostatistiske side er interessen også vokset, og igen med forsøgsplanlægningen som et centralt element.

Men hvordan er status og perspektiverne, nu hvor sølvbrylluppet er (vel) overstået? Det spørgsmål vil jeg forsøge at besvare nedenfor ved hjælp af to mindre litteraturstudier. I det første litteraturstudie ser jeg på forekomsten af artikler, der er klassificeret som værende direkte relateret til forskning i almen medicin, i to biostatistiske tidsskrifter, Biometrics og Statistics in Medicine. På baggrund af disse resultater ser jeg i det andet litteraturstudie på, hvilke forsøgsdesign, subsidiært analyser, der blev anvendt i studier, der er publiceret i Scandinavian Journal of Primary Health Care i 2001. Her er der særlig fokus på, om forsøgsdesignet og/eller analysen inddrog den såkaldte cluster (klynge)-effekt.

Lad os imidlertid først se nærmere på, hvad en cluster -effekt er, og hvorfor den er relevant for almen medicinsk forskning.

»Cluster«-effekt

I klassiske statistiske analyser betragtes de enkelte observationer som uafhængige, givet de relevante kovariater som fx behandling, alder, køn m.m. Det betyder, at hver eneste observation bidrager med »ny« information til studiet. I forbindelse med almen medicinske studier forekommer det imidlertid hyppigt, at flere af de involverede patienter har samme læge, og i denne situation er uafhængighedsantagelsen kritisk.

Antag fx at vi vil studere proportionen af symptomfrie dage hos patienter med dyspepsi. Antag nu (hypotetisk) at den enkelte læge behandler alle sine patienter ens, og at de derfor alle har identisk respons (meget hypotetisk). Tydeligvis er det i denne situation nok at kende en enkelt patients respons for hver læge, idet vi da kender udfaldet for alle den pågældende læges efterfølgende patienter. Dette er vist i Fig. 1 , hvor hver enkelt streg viser responsen hos alle den pågældende læges patienter. I dette tilfælde er den sande stikprøvestørrelse antallet af læger, der deltager i studiet, og al variation kan henføres til lægerne.

Antag nu modsætningsvis, at lægen ingen indflydelse har på patienternes respons. Nu er det åbenlyst ligegyldigt, om vi inddrager flere patienter hos den samme læge eller udvider forsøget med nye læger og deres patienter. Her er den sande stikprøvestørrelse altså antallet af patienter. Denne situation er præsenteret i Fig. 2 . Cluster -effekt kan altså defineres som fravær af uafhængighed i observationer, der tilhører veldefinerede grupper.

I realistiske situationer findes sandheden selvfølgelig et sted imellem de to ekstremer. Det bliver dermed vigtigt både i designet og i analysen at inddrage cluster -aspektet, idet en a priori-antagelse om uafhængighed sjældent er valid. I designet er der risiko for at være for optimistisk mht. den nødvendige stikprøvestørrelse, mens risikoen i analysen er at få kunstigt smalle konfidensintervaller og tilhørende lave p-værdier, hvis en betydelig cluster -effekt ignoreres. Hvis studiet er tænkt som randomiseret, bør det overvejes, om det er lægerne, der skal randomiseres, eller om det er patienterne inden for hver praksis. Er cluster -effekten stor, vil det typisk være en fordel at randomisere patienterne, idet man da kan foretage analysen, så sammenligningen sker mellem patienter med samme læge. Dette er imidlertid ikke altid muligt, typisk fordi det enten vil være for besværligt for lægen at skulle administrere flere behandlingsprotokoller, eller fordi interventionen er direkte rettet mod lægen.

Det bør også understreges, at uanset om studiet er randomiseret eller ej, bør analysen inddrage cluster -aspektet i situationer, hvor patienterne kan inddeles i klart definerede grupper, så man ikke a priori kan garantere uafhængighed mellem alle responser. Analysestrategierne i disse situationer kan groft opdeles i tre: 1) Stratificerede modeller, dvs. for hvert cluster udregnes der en værdi, fx et gennemsnit, som så bruges som respons i den efterfølgende analyse (evt. vægtet med cluster -størrelsen, hvis disse varierer meget). Denne model er valid, men ikke altid optimal, den muliggør ikke inddragelse af øvrige kovariater og kan derfor kun anvendes ved simple problemstillinger. 2) Generalized estimating equations (GEE), hvor ideen er justering af usikkerhedsestimaterne, så konfidensintervallernes dækningssandsynlighed svarer til den nominelle værdi. Denne model kan uden videre også anvendes for ikkenormalfordelte data, se fx introduktionen i (1). 3) Multilevel -modeller (kaldes også hierarkiske eller varianskomponentmodeller) hvor varianskilderne eksplicit modelleres. Denne model er mest anvendelig for data, der kan antages at være normalfordelte se fx (2-4) for en praktisk indføring.

En glimrende (om end lidt teknisk) reference vedrørende design og analyse af cluster -randomiserede forsøg er (5).

Litteraturstudie I
Metode

I de to internationale biostatistiske tidsskrifter, Biometrics og Statistics in Medicine blev alle artikler med »primary health care « eller »family practice « som medical subject heading fundet. Søgningen blev udført i PubMed-databasen (6).

Da der blot blev fundet ni artikler i alt ved disse første søgninger, blev der efterfølgende søgt på alle artikler i de to tidsskrifter, hvor ordene general practice indgik i titel eller i resumé. Herved fandtes yderligere to artikler.

Resultater

Alle elleve artikler blev publiceret i Statistics in Medicine (7-17). Emnet for syv af artiklerne var designet og analysen af cluster -randomiserede studier.

Af de øvrige fire behandlede man i en af artiklerne et nyt mål for behandlingskontinuitet (7), i en anden så man på statistiske modeller for ændring af ordinationspraksis (17), i en tredje så man på en forsøgsstrategi for symptomatisk definerede tilstande (som eksempel nævnes høfeber) (16), mens man i den sidste analyserede binære data fra en audit (15).

Af de i alt elleve artikler stammer de seks fra samme nummer. Det skyldes ikke en tilfældighed, idet dette nummer (3), var specielt dedikeret til design og analyse af cluster -randomiserede studier.

Diskussion

Studiet af statistiske problemer i forbindelse med almen medicinsk forskning er i høj grad knyttet til cluster -problematikken. Det skyldes formentlig, at problemet er særlig tydeligt i almen medicin, hvor den enkelte læge ofte er i centrum for både den givne behandling og for dataindsamlingen. Selv om det umiddelbart er patienten, observationerne stammer fra, er det svært at forestille sig, at disse er uafhængige af lægen.

Der er dog spæde tegn på, at interessen er ved at blive udvidet til emner, der må siges at være unikke for almen medicin, fx behandlingskontinuitet og symptomatisk definerede tilstande. En sådan involvering af biostatistikere i egentlig metodeudvikling er endnu et tegn på, at almen medicinsk forskning er ved at få sin egen, mere veldefinerede faglige profil. Cluster -problematikken er ikke ny fra et statistisk synspunkt, og måske er der derfor ingen artikler med særlig fokus på almen medicin i det mere teoretiske tidsskrift Biometrics.

Litteraturstudie II

Hvordan ser det så ud i den almen medicinske forskning? Har den biostatistiske indsats sat sig spor i den publicerede forskning? For at besvare dette har jeg undersøgt årgang 2001 af almen medicinske forskningsartikler i to tidsskrifter: Scandinavian Journal of Primary Health Care (SJ) og British Medical Journal (BMJ).

Metode

For SJ blev alle artikler inkluderet i studiet, da dette tidsskrift har som erklæret mål at publicere artikler, der er relevante for almen praksis, og specielt artikler som »... bidrager til udviklingen af videnskabelige metoder, der er nødvendige for forskning i almen medicin« (forfatterens oversættelse). For BMJ blev søgningen vha. PubMed-databasen begrænset til egentlige originalartikler med »family practice « som medical subject heading . For begge tidsskrifter blev alle artikler baseret på kvalitative metoder ekskluderet.

Resultat

I alt blev der fundet 66 artikler, 43 i SJ og 23 i BMJ. Af disse var der i hvert tidsskrift 12 interventionsstudier (med hhv. tre og en uden kontrolgruppe [sic!]). Blandt interventionsstudierne var der fem og 11 randomiserede studier i hhv. SJ og BMJ. I SJ var et af studierne cluster -randomiseret (18), det samme var tilfældet for fem af de randomiserede studier, der var publiceret i BMJ (19-23).

I alle artikler var cluster defineret ved tilhørsforhold til en given praksis. I SJ-artiklen (18) blev clustering ignoreret i analysen. Af de fem BMJ-artikler, anvendte man GEE i to (19, 22), i to anvendte man multilevel-modeller (19, 20), mens man i den sidste artikel ignorerede en mulig cluster -effekt (22).

For de to tidsskrifter SJ og BMJ kunne der findes hhv. 13 og 15 artikler, hvor det syntes oplagt, at man i analysen burde have inddraget cluster -aspektet. Ud fra beskrivelserne af de udførte analyser fremgik det for seks af artiklerne i BMJ, at cluster -effekten var blevet inddraget (ud over de fire ovenfor nævnte var det (24, 25)). I alle øvrige artikler syntes en eventuel cluster -effekt at være blevet ignoreret.

Diskussion

Ikke overraskende har den forholdsvis nye biostatistiske forskning i cluster -effekt ikke vundet fuldt indpas på det almen medicinske forskningsområde, i modsætning til fx forskningen i børns indlæring (cluster udgøres her af skoler og/eller klasser) eller epidemiologiske studier af miljøeffekter (her definerer områderne cluster ). En bevægelse synes dog at være sat i gang, idet der faktisk i 2001 i et af de mest prestigefyldte internationale tidsskrifter, BMJ, var artikler, hvor design og/eller analyse inddrog dette aspekt.

Konklusion og perspektiver

Efterhånden som relationerne mellem biostatistisk og almen medicinsk forskning er blevet etableret, synes der fra begge sider at være blevet rejst frugtbare problemstillinger. Et centralt eksempel har hidtil været design og analyse af cluster -randomiserede forsøg. Det må her forudses, at de statistiske metoder til håndtering af dette på lidt længere sigt vil indgå som standardmetoder i almen medicinsk forskning.

To af de allernyeste biostatistiske publikationer (6, 16) synes at indikere begyndelsen på næste fase: I den første artikel forsøges det almen medicinske kernebegreb behandlingskontinuitet defineret og analyseret, mens den anden opstiller en model for praktiserende lægers farmakaordinationer. Nogle af de centrale almen medicinske begreber bliver således gjort til genstand for en egentlig statistisk modellering, og dermed bliver det almen medicinske område endnu mere interessant fra en biostatistisk synsvinkel, idet disse problemstillinger må forventes at rejse dybe forskningsmetodologiske spørgsmål.

Omvendt må en statistisk diskussion og afklaring af de grundlæggende begreber for almen medicinsk forskning forventes at betyde en yderligere styrkelse af almen medicins faglige profil, hvilket vil være gavnligt for feltets konsolidering og udvikling.


Summary

New biostatistical methods in the research of family practice. A literature survey.

Ugeskr Læger 2002; 164: 5399-402.

As the research field of family practice has matured, the field has received increasing interest from biostatisticians. A review of the methodological developments within the biostatistical research field related to research on family practice is presented. The review is based on a literature study of the journals Statistics in Medicine and Biometrics . The problem of clustering is identified as a central issue, and is hence given a more detailed introduction and discussion. Finally, a literature study based on the journals British Medical Journal and Scandinavian Journal of Primary Health Care - restricted to the year 2001 - is presented. It is concluded that the statistical research on clustering has influenced recent papers published on family practice, but not all the papers, for which it would seem relevant, have made use of the developed methods.


Henrik Støvring , Syddansk Universitet, Forskningsenheden for Almen Medicin, Winsløwparken 19, 3., DK-5000 Odense C. E-mail: hs@ncrr.dk

Antaget den 24. september 2002.
Syddansk Universitet, Forskningsenheden for Almen Medicin, og
Aarhus Universitet, Center for Registerforskning.

Ovenstående artikel hviler på en større litteraturgennemgang end litteraturlistens 24 numre. Oplysninger om denne baggrundslitteratur kan fås fra forfatteren.




Referencer

  1. Zeger SL, Liang K-Y. An overview of methods for the analysis of longitudinal data. Stat Med 1992; 11: 1825-39.
  2. Cnaan A, Laird NM, Slasor P. Tutorial in biostatistics: using the general linear mixed model to analyse unbalanced repeated measures and longitudinal data. Stat Med 1997; 16: 2349-80.
  3. Sullivan LM, Dukes KA, Losina E. Tutorial in biostatistics. Stat Med 1999; 18: 855-88.
  4. Verbeke G, Molenberghs G, eds. Linear mixed models in practice: a SAS oriented approach. Vol. 88 of Lecture notes in statistics. New York: Springer, 1997.
  5. Murray DM. Design and analysis of group-randomized trials. Vol. 27 of Monographs in epidemiology and statistics. New York: Oxford University Press, 1998.
  6. Http://www.ncbi.nlm.nih.gov/PubMed/, maj 2002.
  7. Hussein A, Carriere KC. A measure of continuity of care based on the multiplicative intensity model. Stat Med 2002; 21: 457-65.
  8. Turner RM, Omar RZ, Thompson SG. Bayesian methods of analysis for cluster randomized trials with binary outcome data. Stat Med 2001; 20: 453-72.
  9. Spiegelhalter DJ. Bayesian methods for cluster randomized trials with continuous responses. Stat Med 2001; 20: 435-52.
  10. Kerry SM, Bland JM. Unequal cluster sizes for trials in English and Welsh general practice: implications for sample size calculations. Stat Med 2001; 20: 377-90.
  11. Eldridge S, Cryer C, Feder G, Underwood M. Sample size calculations for intervention trials in primary care randomizing by primary care group: an empirical illustration from one proposed intervention trial. Stat Med 2001; 20: 367-76.
  12. Yudkin PL, Moher M. Putting theory into practice: a cluster randomized trial with a small number of clusters. Stat Med 2001; 20: 341-9.
  13. Moore H, Summerbell C, Vail A, Greenwood DC, Adamson AJ. The design features and practicalities of conducting a pragmatic cluster randomized trial of obesity management in primary care. Stat Med 2001; 20: 331-40.
  14. Roberts C. The implications of variation in outcome between health professionals for the design and analysis of randomized controlled trials. Stat Med 1999; 18: 2605-15.
  15. Raab GM, Elton RA. Bayesian analysis of binary data from an audit of cervical smears. Stat Med 1993; 12: 2179-89.
  16. Charlton JR, D'Souza MF, Tooley M, Silver R. A community trial strategy for evaluating treatment for symptomatic conditions. Stat Med 1985; 4: 11-21.
  17. Sithole JS, Jones PW. Repeated measures models for prescribing change. Stat Med 2002; 21: 571-87.
  18. Groeneveld Y, Petri H, Hermans J, Springer M. An assessment of structured care assistance in the management of patients with type 2 diabetes in general practice. Scand J Prim Health Care 2001; 19: 25-30.
  19. Olivarius NF, Beck-Nielsen H, Andreasen AH, Hørder M, Pedersen PA. Randomised controlled trial of structured personal care of type 2 diabetes mellitus. BMJ 2001; 323: 970-5.
  20. Moher M, Yudkin P, Wright L, Turner R, Fuller A, Schofield T et al. Cluster randomised controlled trial to compare three methods of promoting secondary prevention of coronary heart disease in primary care. BMJ 2001; 322: 1338.
  21. Morrison J, Carroll L, Twaddle S, Cameron I, Grimshaw J, Leyland A et al. Pragmatic randomised controlled trial to evaluate guidelines for the management of infertility across the primary care-secondary care interface. BMJ 2001; 322: 1282-4.
  22. Van Eijk ME, Avorn J, Porsius AJ, de Boer A. Reducing prescribing of highly anticholinergic antidepressants for elderly people: randomised trial of group versus individual academic detailing. BMJ 2001; 322: 654-7.
  23. Little P, Gould C, Williamson I, Moore M, Warner G, Dunleavey J. Pragmatic randomised controlled trial of two prescribing strategies for childhood acute otitis media. BMJ 2001; 322: 336-42.
  24. Campbell SM, Hann M, Hacker J, Burns C, Oliver D, Thapar A et al. Identifying predictors of high quality care in english general practice: observational study. BMJ 2001; 323: 784-7.
  25. Heaney D, Wyke S, Wilson P, Elton R, Rutledge P. Assessment of impact of information booklets on use of healthcare services: randomised controlled trial. BMJ 2001; 322: 1218-21.