Vedrørende artiklen af Thorleifsson et al i Ugeskrift for Læger [1].
Forfatterne skriver i resultatafsnittet, at formålet med en bestemt analyse er »at analysere sammenhængen mellem harm avoidance (HA) og WHO's Major Depression Inventory (MDI) ved udskrivning og i distriktspykiatrisk regi«. Uden særlig begrundelse vælger de »en lineær normalmodel«. Efter forskellige analyser når de frem til en bestemt model, som kun indeholder prædiktoren HA. De finder en »grænsesignifikant sammenhæng« (p = 0,045). Der bliver givet specifikke oplysninger om modellen, og den er afbildet i Figur 2.
Mit problem er relevansen af den valgte model. Kan man kalde (n = 43) for et »stort« antal? Har man sikret sig, at »normalitetsantagelsen« holder for de to variable, der indgår? Et umiddelbart studium af Figur 2 viser, at 24 ud af de i alt 43 observationer, eller ca. 56% (!), falder uden for modellens 95% konfidensinterval. Ud fra min forståelse af grundlæggende statistik burde højst 5% falde uden for et 95% konfidensinterval - hvis den valgte model er relevant. Så hvad er det egentlig den valgte model »forudsiger« - og med hvilken præcision?
En simpel analyse af residualer burde have bragt forfatterne på sporet af dette problem (se [2] - især kap. 3). Alle nutidige statistikpakker (f.eks. Statistix9 og Stata) har udmærkede og effektive algoritmer til analyse af residualer.
En grundbog i statistik [3] har følgende anbefaling, hvis man ønsker at »vise og estimere en sammenhæng mellem to variable« - brug korrelationskoefficienter (Table 15.1 på side 564). Dette ville formentlig lede frem til en illustration hvor 95% konfidensintervallet ville minde om en cirkel, som er trukket ganske lidt ud.
Grunden til, at dette er en vigtig pointe, er, at forfatterne i diskussionsafsnittet kaster tvivlen over bord og skriver, at »HA i vores patientmateriale er signifikant (ikke grænsesignifikant som i spalten over for) positivt korreleret med MDI ...«.
Det er overordentlig beklageligt, at Ugeskriftets faglige bedømmere ikke har fanget de åbenlyse problemer i dette arbejde og derved har bidraget til at udbrede meget dårlige statistiske vaner og værst af alt givet indtryk af, at der var en »mening« med sammenstillingen af disse to variable, selv om data tydeligvis viser, at der er problemer. Man lever ikke op til Ugeskriftets pædagogiske forpligtelser over for læserne. At tillade letbenetheder som disse, er at bringe Ugeskriftet ned på niveauet for Dagens Medicin eller andre former for spindoktorer.
> Svar:
♠ Cand.scient. Klaus Holst, Biostatistisk Afdeling, Københavns Universitet E-mail: k.k.holst@biostat.ku.dk. 1. reservelæge Ari Thorleifsson, Psykiatrisk Center Gentofte og Overlæge Henrik Folker, Psykiatrien Region Sjælland, Roskilde, Distrikt Nord
I sit læserbrev stiller Søren Nielsen (SN) spørgsmålstegn ved, om regressionsanalysen mellem WHO's Major Depression Inventory (MDI) og harm avoidance (HA) i artiklen »Personlighedstest og prædiktion af antidepressiv behandlingseffekt ved psykisk sygdom« (Ugeskr Læger 2010;172:539-44) er meningsfyldt set ud fra et teknisk synspunkt. SN har i sin kritik desværre forvekslet konfidensgrænser med prædiktionsgrænser. I artiklen har vi i Figur 2 optegnet punktvise konfidensgrænser, som angiver usikkerheden på den estimerede regressionslinje. Disse grænser har den egenskab, at de bliver snævrere med voksende antal observationer, og andelen af observationer uden for 95%-grænserne vil tilsvarende stige. Dette er i modsætning til prædiktionsbånd, hvor hensigten er at udtale sig om prædiktionen af endnu ikke gjorte observationer, og som med en dækningsgrad på 95% i middel bør indeholde 95% af observationerne.
SN stiller også spørgsmålstegn ved normaliteten af de to variable, der indgår i analysen. Antagelserne for den lineære regressionsanalyse vedrører imidlertid kun residualet, og der kan derfor betinges med kovariater, som afviger fra normalfordelingen, f.eks. binære variable. Vi må understrege, at analyserne, som det antydes i artiklen, har været underkastet en omfattende modelkontrol af de korrekte modelantagelser vedrørende linearitet og fordeling.
Den af SN foreslåede analyse via udregning af en korrelationskoefficient er ikke i uoverenstemmelse med den simple lineære regressionsanalyse vi har rapporteret. De af SN foreslåede prædiktionsgrænser er dog baseret på antagelse om bivariat normalfordeling. Korrelationen er præcis hældningen i den simple lineære regressionsmodel gange forholdet mellem standardafvigelserne af den forklarende variable og responsvariablen. p-værdierne for testet om, hvorvidt hældningen er 0 henholdvis korrelationen er 0, er endvidere identiske. At tale om en positiv korrelation mellem MDI og HA er derfor korrekt sprogbrug, ligesom en grænsesignifikant effekt med en p-værdi på 0,045 jo stadig er statistisk signifikant på et 5%-niveau.
Referencer
- Thorleifsson A, Holst K, Diaz M et al. Personlighedstest og prædiktion af antidepressiv behandlingseffekt ved psykisk sygdom. Ugeskr Læger 2010;172:539-44.
- Draper NR, Smith H, red. Applied Regression Analysis. 2. ed. John Wiley & Sons, 1981.
- Sokal RR, Rohlf FJ. Biometry: The Principles and Practices of Statistics in Biological Research. 2. ed. New York: W.H. Freeman and Co, 1981.