Skip to main content

Kommentar til den statistiske usikkerhed - livets forfærdeligheds princip

Læge Lars Folkestad, ph.d.-studerende Michael Gejl Jensen, læge Mikkel Brabrand, læge Dan Brun Petersen, afdelingslæge Peter Hallas & ledende overlæge Torben Knudsen Sydvestjysk Sygehus Esbjerg, Medicinsk Center og Medicinsk Gastroenterologisk Afdeling, Aarhus Universitet, Farmakologisk Institut, Kolding Sygehus, Akut Modtagesfdeling, og Rigshospitalet, Juliane Marie Centeret, Anæstesiologisk afdeling 4013

18. mar. 2010
13 min.


Introduktion: Vi har alle stået i situationen; det regner, og vi tager nøglerne frem, kun en af de to nøgler er den rigtige. Den matematiske sandsynlighed for at vælge den rigtige nøgle er 50%. I løbet af 1990'erne fremførte cand.scient. Jarle Gundersson et matematisk uforklarligt usikkerhedsmoment i sandsynlighedsberegning. Han brugte netop eksemplet med nøglerne, og angav at den reelle, eller observerede, sandsynlighed for at vælge den rigtige nøgle var 5-10%. Denne diskrepans mellem matematisk og reel sandsynlighed skyldes, ifølge Gundarsson, livets forfærdeligheds princip (LFP). Vi fremlægger i denne artikel resultaterne fra en spørgeskemaundersøgelse, der var designet til at finde forskellen mellem den matematiske og observerede sandsynlighed i to scenarier (held til at vinde i plat eller krone og held til at vælge rigtig nøgle).

Materiale og metoder: Tværsnitsanalyse blandt ansatte på Sydvestjysk Sygehus Esbjerg, der blev gennemført d. 18-19. september 2009.

Resultater: Der er diskrepans mellem den matematiske og observerede sandsynlighed i begge scenarier. For plat og krone i 64% af tilfældene og i 68% af tilfældene i at vælge nøgle. Derudover ses, at den observerede sandsynlighed for at vinde i plat og krone er negativt korreleret til stigende alder, mens den observerede sandsynlighed for at vælge rigtig nøgle stiger med alderen, dog uden statistisk signifikans.

Konklusion: I forlængelse af LFP var vores hypotese, at man altid taber i plat eller krone, og at man aldrig vælger rigtig nøgle i første forsøg. Hypotesen blev manet til jorden, men vi fandt, at der er forskel på den matematiske og den observerede sandsynlighed.

I slutningerne af 1990'erne fremlagde cand.scient. Jarle Gundersson et matematisk uforklarligt usikkerhedsmoment i al sandsynlighedsberegning. Gundersson benævnte denne usikkerhed livets forfærdeligheds princip. Dette gik i al sin enkelhed ud på, at i en situation med to mulige udfald er der forskel på den observerede sandsynlighed og den matematiske sandsynlighed. Den observerede sandsynlighed kan defineres som succesraten for den enkelte person i den givne situation. I fremlæggelsen af princippet benyttede Gundersson følgende eksempel: Hvis man har to ens udseende nøgler, hvor kun den ene er i stand til at låse døren op, vil den matematiske sandsynlighed være 50% eller en ud af to ved gentagne forsøg. Hvis man undersøger den observerede sandsynlighed for, at man i første forsøg kan låse døren op, vil denne nærmere være 5-10%. Denne diskrepans mellem den matematiske og den observerede sandsynlighed kaldes livets forfærdeligheds princip.

Da man i meget medicinsk forskning og dermed behandling af patienter undersøger sandsynligheden for udfald a eller b ved en given behandling, er det væsentligt at have livets forfærdeligheds princip in mente.

Vi vil i denne artikel fremlægge resultatet af en undersøgelse af livets forfærdeligheds princip på en dansk population.

Materiale og metoder

I perioden fra 18. september til 19. september 2009 blev der gennemført en spørgeskemaundersøgelse på papir og e-mail. Forsøget blev udført som en tværsnitsundersøgelse blandt læger og plejepersonale på flere afdelinger på Sydvestjysk Sygehus Esbjerg, samt som e-mail-rundspørge til venner, familie og tidligere arbejdskollegaer til LF.

I skemaet skulle man svare på to spørgsmål: »Når du spiller plat og krone, hvor ofte vinder du så?« og »Når du skal åbne en låst dør og har to ens nøgler i hånden, hvoraf kun den ene kan åbne døren, hvor ofte vælger du den rigtige nøgle i første forsøg?«. Svarmulighederne var: altid, aldrig, mere end halvdelen af gangene, halvdelen af gangene eller mindre end halvdelen af gangene. Der blev endvidere spurgt til køn og alder, se Figur 1 for detaljer.

Spørgeskemaet er valideret via en testgruppe (to personer) og et pilotprojekt (fire personer). En af forsøgsdeltagerne i pilotundersøgelsen svarede, at hun altid vandt i plat og krone og altid kunne åbne en dør i første forsøg. Hun blev testet mod en forsøgsperson, der angav altid at tabe i plat og krone. Da kvinden vandt som forudset, og da hun låste døren op i første forsøg, anses spørgeskemaet for valideret.

Statistisk metode

Data fremlægges deskriptivt. Fraset lineær regressionsanalyse ved hjælp af Zars metode på forholdet mellem held og alder i de to scenarier samt i forholdet mellem held i at vinde i plat og krone samt held til at vælge rigtig nøgle.

Etiske overvejelser

Det er vores iagttagelse, at nogle personer - som eksempelvis morderen i den oscarbelønnede film No Country for old Men - tilsyneladende anvender plat og krone til en del vigtige afgørelser [1]. For ikke at skabe unødig diskussion eller bringe plat eller krone som beslutningsværktøj i miskredit, har vi valgt at lade undersøgelsen være anonym. Hvad angår svar pr. e-mail, er kun LF bekendt med svarene.

Man kan stå i en situation, hvor det at kunne låse sin dør op meget hurtigt er af stor betydning, og forfatterne ligger jo inde med viden om en række personer, der gør valget om hvem, der skal åbne døren, afgørende, hvilket gør sig gældende i et væld af skræk- og splatterfilm [2]. Forfatterne har derfor valgt at fortælle deltagerne, at de skal være meget ærlige omkring deres held til at vælge rigtig nøgle, når de er samlet i større grupper. Da det ville være ærgerligt, hvis man mister værdifuld tid til oplukningsforsøg, hvis der er andre med større held til at vælge den rigtige nøgle i gruppen.

Resultater

Der deltog 51 personer i undersøgelsen, hvoraf 51 besvarede spørgsmålet om nøgler (100%), og 50 besvarede spørgsmålet om plat eller krone (98%). I alt 17 af deltagerne var kvinder med en gennemsnitsalder på 33 (spredning: 16-60) år. I alt 32 var mænd med en gennemsnitsalder på 34 (spredning: 26-57) år. Tre mænd kunne ikke huske deres alder, og to deltagere kunne ikke opgive hverken køn eller alder, hvil ket er uheldigt.

Data for hele populationens observerede sandsynlighed for at vinde i plat eller krone og held til at vælge den rigtige nøgle er vist i Figur 2 , Figur 3 og Figur 4 . Figurerne viser fordelingen af svar for hele populationen samt for kvinder og mænd alene.

Kun 36% af deltagerne angav, at de vinder i plat eller krone halvdelen af gangene. Dette gør, at der er diskrepans mellem den matematiske og observerede sandsynlighed for at vinde i plat eller krone hos 64% af deltagerne. Hos kvinderne er det kun 13%, der vinder halvdelen af gangene, og 50% hos mændene. De to, der ikke har opgivet køn, enten taber altid i plat eller krone eller taber mere end halvdelen af gangene, de spiller, så vi formoder, at den ene er kvinde og den anden er intetkøn.

Hvis man kigger på hele populationen, vælger kun 33% rigtig nøgle i halvdelen af tilfældene, altså er der forskel mellem den matematiske og den observerede sandsynlighed i 68% af tilfældene. 38% af mændene og 29% af kvinderne vælger rigtig nøgle i første forsøg. De to, der ikke har angivet køn, vælger altid eller aldrig rigtig nøgle, når de har to ens nøgler, så det følger uheldigvis ikke vores ovenstående konklusion om deres køn.

Hvis man sammenholder held og alder i de to scenarier, ser man af X-Y-plot (Figur 5 ), at deltagerne har faldende sandsynlighed for at tabe i plat og krone med stigende alder, men alder giver stigende held i valg af nøgle, når man har to ens nøgler og en lås.

Når man benytter Zars metode til lineær regression, ser man, at der ikke er nogen statistisk signifikant sammenhæng mellem alder og held, hvad angår plat eller krone (p = 0,34) samt for alder og evnen til at vælge rigtig nøgle (p = 0,05). Benytter man samme metode til at undersøge, om der er sammenhæng mellem held til at vinde og held til at vælge rigtig nøgle, finder vi en statistisk signifikant sammenhæng (p = 0,02).

Diskussion

Selv om den matematiske sandsynlighed for begivenhed a eller b (plat eller krone/rigtig eller forkert nøgle) i de to scenarier begge er 50%, viser undersøgelsen, at den observerede sandsynlighed antages at være anderledes end den matematiske i de to scenarier, vi har opstillet. Vi fandt ikke, at deltagerne i ni ud af ti tilfælde angav at vælge forkert nøgle eller tabte i plat eller krone, som Gundersson rapporterede i slutningen af 1990'erne ud fra erfaringer fra en vestnorsk population. Det er uvist, om den geografiske forskel i de to populationer spiller nogen rolle. Det er dog ikke utænkeligt, at personer i Vestnorge er mere uheldige end danskere. Ser man eksempelvis på mængden af nedbør, fik man i Bergen (Vestnorge) i 2008 2.552,4 mm nedbør, hvilket er 2,4 mm over gennemsnittet [4], mens man i Danmark i 2009 havde ti flere sommerdage end i året før [5].

Norge er dog også et heldigt land. Eksempelvis hiver de årligt en kæmpe formue hjem på olie, og ifølge FN er det det næstbedste land at bo i [6]. Dog er der ikke skandinavisk konsensus om, hvorvidt det skyldes held eller mådehold. Omvendt er Danmark ifølge psykologen Andy White [7] verdens lykkeligste land, og for at være lykkelig må man også være heldig. Sammenhængen med held er illustreret ved, at man i dansk sprogbrug anvender udtrykket »held og lykke«.

Vore resultater viser, at der er store kønslige forskelle i, hvordan man opfatter sit held. Det viser sig blandt andet, at mænd oftere end kvinderne mener, at de vinder i plat eller krone, hvorimod kvinderne har større held med at vælge rigtig nøgle. Dog angiver en større andel af kvinder end mænd, at de aldrig vælger rigtig nøgle eller vinder i plat eller krone. Det er forfatternes erfaring, at mænd oftere end kvinder fokuserer mere på at vinde end på at deltage. Måske derfor husker de oftere, at de vinder i plat eller krone.

Plat og krone-testen er forbundet med nogen usikkerhed, da studier har vist, at der kan implementeres bias i måden, hvorpå man kaster mønten [7]. Endvidere er det vist, at hvis man ikke skifter mellem plat og krone for hvert gentaget forsøg, vil sandsynligheden for plat eller krone ændres. Således at den ikke bliver 50% procent for enten plat eller krone, men 49% mod 51% til fordel for den side, der vender opad [8]. Selv hvis vi antager, at sandsynligheden for at vinde i plat eller krone er 49%, underestimeres vindersandsynlighederne i vores undersøgelse.

Murphys lov definerer, at alt, hvad der kan gå galt, vil gå galt [9]. Om årsagen til, at deltagerne i undersøgelsen har svært ved at vælge den rigtige nøgle skyldes en variant af Murphys lov, kan overvejes. Hvis Murphys lov skulle være årsagen til nøglevalget, burde det være helt umuligt at åbne en dør i første forsøg. Vi tror derfor, at årsagen til forskellen mellem den matematiske og den observerede sandsynlighed skyldes livets forfærdeligheds princip.

De amerikanske psykologer Dunning & Kruger [10, 11] viste efter spørgeskemaundersøgelser, hvor de bad deltagerne angive, hvordan de ville klare sig i forhold til de andre deltagere, at deltagerne ofte overestimerede deres egne evner. Spørgeskemaundersøgelserne havde fokus på humoristisk sans, logisk sans og engelsk grammatik. I undersøgelserne fandt forfatterne, at langt over halvdelen af deltagerne overestimerede deres evner inden for alle de tre undersøgelsesområder. Dunning & Kruger konkluderede, at mennesker ofte laver forkerte konklusioner og tager uheldige valg, men deres inkompetence hindrer dem i at have en metakognitiv evne til at indse det. De lever i en illusion af overlegenhed og vurderer egne evner som over middel. Med andre ord, inkompetente er også inkompetente til at vurdere deres egne evner [10, 11]. Når man kigger på resultaterne fra Programme for International Student Assessment (PISA)-undersøgelsen fra 2006, ligger Danmark i gennemsnitsgruppen for naturfag og læsning, men lidt over Organisation for Economic Co-operation and Development (OECD)-landenes gennemsnit, når det gælder matematik [12]. Man kan på disse punkter ikke sige, at danskere er inkompetente, snarere middelmådige. Om evnen til manglende selvindsigt har spillet en rolle i vores undersøgelser er uvist. Men hvis vi følger Dunning & Krugers argument, vil heldet i vores gruppe nok være mindre, end de angiver.

Vi fremlægger data deskriptivt i dette studie, fraset data om tendens i held med alderen og held ved held. Der ses en tydelig tendens til, at man står dårligere i plat eller krone med stigende alder. Det kan overvejes, hvorvidt dette skyldes, at ens held bliver opbrugt med alderen, eller om yngre deltagere bedre kan huske, hvor ofte de vinder. I modsætning hertil ses, at man bliver bedre til at låse døre op i første forsøg med alderen. Her antages det, at der er tale om en ren organisatorisk bedring - altså, at yngre deltagere ikke har et fastlagt nøglesystem, de kan benytte og derfor oftere vælger forkert nøgle. Der findes ingen statistisk signifikant sammenhæng mellem alder og held, men vi mener ikke, at vi kan tillægge dette resultat nogen værdi, netop på grund af livets forfærdeligheds princip. Der er dog en statistisk signifikant sammenhæng mellem at være en vinder i plat eller krone og at have held til at kunne vælge rigtig nøgle. Altså hvis man er heldig, så er man heldig. Dette fænomen er velkendt i litteraturen og er bedst beskrevet af Walt Disney i historier om fætter Højben.

Konklusion

Vi finder ikke, at livets forfærdeligheds princip slår lige hårdt igennem som statistisk usikkerhed i den population, vi har undersøgt, som oprindeligt rapporteret af Gundersson . Vi finder dog, at der er stor diskrepans mellem den matematiske sandsynlighed og den observerede sandsynlighed. Studiet og livets forfærdeligheds princip kan rejse tvivl om, hvorvidt matematisk sandsynlighed overhovedet kan benyttes i medicinsk forskning. Det er således vigtigt med yderligere forskning i, om netop livets forfærdeligheds princip gør sig gældende i medicinsk forskning. Indtil da opfordrer vi til observationelle studier eller studier med klart definerede endepunkter, og som ikke skal rapporteres af forsøgspersonerne selv. Så, som en klog mand engang har sagt, hvis man laver forsøg, hvor det er nødvendigt at anvende statistik, skal man lave et andet forsøg.


Lars Folkestad , Medicinsk Center, Sydvestjysk Sygehus -Esbjerg, DK-6700 Esbjerg. E-mail: larsfolkestad@surfmail.dk

Interessekonflikter: Ingen

Taksigelser: Tak til Thorkil Hallas for korrekturlæsning.







Summary

Summary Life just is not fair - and statistics do not make it any better Ugeskr Læger 2009;171(51):3775-3779 We have all tried it: it is pouring down with rain, we reach for the keys, and choose the wrong one. The mathematical probability for choosing the correct key - out of two - is 50%. During the 1990s, candy.scient. Jarle Gundersson (JG) proposed a mathematically unexplainable factor of uncertainty. He used the above example with the keys and concluded that the real, or observed, probability for choosing the correct key was 5-10%. The discrepancy between the mathematical and real probability was, according to JG, caused by The Awfulness of Being Concept. In this article, we present the results from a study and demonstrate the difference between the mathematical and the observed probability of success in two different scenarios (winning a coin toss and choosing the correct key in the first attempt). Material and methods: Questionnaire survey performed at the Regional Hospital of Esbjerg 18-19 September 2009 using staff as questionnaire respondents. Results: We found a discrepancy between the mathematical and observed probability in both scenarios, 64% and 68% of the cases in the two scenarios, respectively. We also found that there is a negative correlation between age and the probability that one will win a coin toss, but a positive correlation between age and choosing the correct key. The results lacked any statistical significance. Conclusion: We hypothesised that you will always loose in a coin toss and never choose the correct key when there are two choices. The study demonstrated that this was incorrect, but there was a difference between the mathematical and the observed probabilities in most of the cases.

Referencer

  1. www.imdb.com/title/tt0477348/ (29. september 2009). The international movie database - No Country For Old Men. Instrueret af Joel og Ethan Cohen, 2007.
  2. www.imdb.com/title/tt0081505/ (29. september 2009). The international movie database - The Shining. Instrueret af Stanley Kubrick, 1980.
  3. http://larrysutton1.tripod.com/horror.html (1. september 2009). The Horror movie survival guide. 325 tips for keeping your sorry butt out of the morgue.
  4. www.met.no (20.september 2009). Meterologisk Institutt.
  5. www.dmi.dk (20. september 2009). Danmarks Meteorologiske Institut.
  6. Watkins K. Fighting climate change: human solidarity in a divided world. Human development report 2007/2008.New York, 2007.
  7. White A. A global projection of subjective well-being: A challenge to positive psychology? Psychtalk 2007;56:17-20.
  8. Diaconis D, Holmes S, Montgomery R. Dynamical bias in the coin toss, SIAM Rev 2007;49,2:211-35.
  9. Matthews, RAJ. Tumbling toast, Murphy's law and the fundamental constants, Eur J Phys 1995;16:172-6.
  10. Dunning D, Johnson K, Kruger J. Why people fail to recognize their own incompetence, Curr Dir Psych Sci 2003;3:83-7.
  11. Kruger J, Dunning D. Unskilled and Unaware of it: How difficulties in recognizing one's own incompetence lead to inflated self-assessments, J Pers Soc Psyc 1999;77:1121-34.
  12. www.skolestyrelsen.dk/skolen/pisa.aspx (26. september 2009).