Statistik i ord. Lund H, Røgind H

Titlen Statistik i ord skal ikke forstås som statistik uden tal, men som statistik uden formler. Helt undvære formler kan man selvfølgelig ikke, når man forsøger at beskrive statistisk metode, men bogen har passende få formler. Bogen er ikke tænkt som en lærebog, men snarere en bog man læser inden sædvanlige lærebøger, der tit kun beskriver det mere tekniske og ikke giver baggrund og motivation.

Da jeg selv er statistiker, er jeg ikke den bedste til at bedømme, hvor letlæst bogen er for begyndere, men jeg synes, den ser rimelig ud. En bog med så stort pædagogisk sigte bør inkludere nærværende eksempler. Det er rart at høre om forfatternes egne problemstillinger, men der er skæverter; vi skal ikke i en lægevidenskabelig bog læse om bananhandleres overskudsgrad og billetsalget ved rockkoncerter.

Ellers tænker jeg mere over, hvorvidt bogen på en fair måde lægger op til den statistiske praksis, der har udviklet sig over de sidste ca. 70 år. Et par steder synes jeg, bogen rammer forkert. Signifikanstesten, som bruges til at bestemme, om en given behandling er bedre end en anden, introduceres med en permutationstest, hvor man sammenligner de opnåede resultater med dem, man ville få ved at bytte om på nogle af patienterne. Det foreslås, at man, når der er så mange patienter med, at dette er beregningsmæssigt urealistisk, i stedet kan lave en test baseret på normalfordelingen. Såvel historisk som i statistisk praksis er det snarere omvendt. Normalfordelingen er første valg, der i tilfælde af tvivl om de bagvedliggende forudsætninger kan erstattes af en permutationstest. Placebogrupper siges at være inkluderet for at tage højde for en mulig psykologisk effekt. Det er også, og måske især, for at tage højde for en spontan helbredelse og en eventuel effekt af forsøgsopstillingen. Hvis patienter f.eks. udvælges for at have højt blodtryk, vil det sandsynligvis falde bare på grund af måleusikkerhed ved den første værdi. Mange eksempler vedrører ændring over tid. Denne forbedring beregnes som efter minus før-værdien. En sådan analyse ville blive afvist af myndighederne, hvis man søgte om registrering af et nyt lægemiddel. I stedet skal man inkludere både før-værdien og behandlingen som forklarende variable. Dette er også for at tage højde for variationskilderne, der udsiger, at dem med de højeste før-værdier vil falde mest. Det gør selvfølgelig de statistiske beregninger mere indviklede, men det er nødvendigt for at få et relevant beslutningsgrundlag.

Jeg savner et kapitel eller afsnit om overlevelsesdata og de problemer, der opstår, fordi levetiden (eller mere generelt tid til de begivenheder der studeres) ikke er kendt for de personer, der er i live ved studiets afslutning, de såkaldte censurerede observationer.

Jeg er enig med forfatterne i, at der er behov for en sådan bog. Det vil sige, at de mennesker, der har svært ved at forstå en almindelig statistikbog, kan have gavn af at læse denne bog først.