Skip to main content

Stikprøvestørrelsesovervejelser til »Der er for få rødhårede professorer«

Colourbox
Colourbox

Sören Möller, lektor og biostatistiker, Open Patient Data Explorative Network, Odense Universitetshospital, og Klinisk Institut, Syddansk Universitet. E-mail: moeller@health.sdu.dk. Interessekonflikter: ingen

20. feb. 2023
2 min.

Jeg har med interesse læst Jacob Rosenbergs artikel »Der er for få rødhårede professorer« [1] i Ugeskrift for Lægers decembernummer. Artiklen er både underholdende og peger på den mulige ulighed, som hårfarve og andre ydre kendetegn kan indebære på det akademiske arbejdsmarked. Desværre lider artiklen under en grundlæggende statistisk fejl, som unødigt svækker artiklens konklusioner.

I artiklens Tabel 1 præsenteres de observerede 236 professorer fra Københavns Universitet (fire af disse er rødhårede) og sammenlignes med en syntetisk gruppe af 236 forventede hårfarver på bagrund af fordelingen rapporteret i en overbliksartikel af Katsara & Nothnagel [2]. Så vidt så godt, men når der så testes for en mulig afvigelse fra fordelingen i [2], anvender Jacob Rosenberg χ2-test for to uafhængige stikprøver begge med stikprøvestørrelse 236 og opnår her p-værdier på 0,000 for den overordnede hårfarvefordeling (blond/rødhåret/mørkhåret) og 0,04 for selve andelen af rødhårede.

Fejlen i denne beregning er, at stikprøvestørrelsen for sammenligningsgruppen (der skal repræsentere den almene danske befolkning) i virkeligheden ikke er 236, men et større, ukendt tal, og testene afrapporteret i [1] er derfor kunstigt svagere end nødvendigt, da de undervurderer den samlede stikprøvestørrelse.

For at afhjælpe dette problem er der grundlæggende to muligheder. Enten kan befolkningsfordelingen fra [2] vurderes som baseret på så stor en stikprøve, at den ikke er behæftet med usikkerhed, eller også kan vi prøve at bestemme den stikprøvestørrelse, som fordelingen fra [2] bygger på. Første mulighed svarer til test for en stikprøve sammenlignet med en fast fordeling, altså til en test for en multinomial fordeling for den overordnede hårfarvefordeling (resulterende i en p-værdi på 0,000) og en test for én proportion for de rødhåredes andel (p-værdi 0,02).

Hvis vi derimod prøver at bruge stikprøvestørrelsen fra [2], møder vi den udfordring, at artiklen ikke rapporterer en stikprøvestørrelse. Ved hjælp af metaanalysemetoder og invertering af formlen for (Wald-)konfidensintervaller for proportioner kan vi dog bestemme en tilnærmet stikprøvestørrelse på 2.055 for artiklen. Med dette antal i kontrolgruppen ville analyserne fra [1] kunne gentages og (igen) resultere i p-værdier på 0,000 for den overordnede fordeling og 0,02 for proportionen af rødhårede.

Sammenfattende kan vi konkludere, at vores resultater stemmer overens med Jacob Rosenbergs konklusioner, dog med mere signifikante resultater. Generelt bør man i sammenligningsstudier være påpasselig med at anvende den korrekte stikprøvestørrelse – ikke kun i den undersøgte gruppe, men også i kontrolgruppen.

Referencer

  1. Rosenberg J. Der er for få rødhårede professorer. Ugeskr Læger 2022;184:V80104.
  2. Katsara MA, Nothnagel M. True colors: a literature review on the spatial distribution of eye and hair pigmentation. Forensic Sci Int Genet. 2019;39:109-18.