Forskelle i praktiserende lægers anvendelse af International Classification for Primary Care-diagnoser

Introduktion: Nogle praktiserende læger diagnosekoder deres patientkontakter. Vi ved imidlertid ikke, i hvilken udstrækning forskellige læger anvender den samme diagnose ved samme kliniske situation, eller om lægerne anvender samme diagnose fra gang til gang ved samme kliniske situation.

Materiale og metoder: Fyrre praktiserende læger, der var uddannet i kodning med International Classification for Primary Care (ICPC), anvendte diagnosekoder på ti skriftlige sygehistorier (vignetter). Fire måneder senere blev lægerne bedt om at kode de samme sygehistorier. Interobservatørvariationen blev vurderet ved procent overensstemmelse i diagnosekodningen. Intraobservatørvariationen blev vurderet ved procent overensstemmelse som ovenfor og ved Cohns Kappaanalyse. Diagnoser for udvalgte lidelser var på forhånd grupperet i større kliniske enheder.

Resultater: Interobservatørvariationen var på enkeltdiagnoseniveau 71%, ved gruppering af diagnoserne steg enigheden til 84%, og på ICPC-kapitelniveau nåede enigheden 94%. Intraobservatørvariationen var for den samlede gruppe af læger lille fra første til anden kodning, men 25% af lægerne skiftede diagnose fra første til anden kodning.

Diskussion: Undersøgelsen viste, at ICPC-kodning kan anvendes
i almen praksis, men at variationen kan være betydelig på enkeltdiagnoseniveau. En gruppering af diagnoserne eller anvendelse af kapiteldiagnoser øger reliabiliteten væsentligt. Undersøgelsen
tyder på, at der er behov for klare kriterier (inklusions- og eksklusionskriterier) for diagnosesætningen.

Diagnosekodning af den enkelte patientkontakt med International Classification for Primary Care (ICPC) vinder i stigende grad indpas i almen praksis. Diagnosekodning frembyder en række umiddelbare fordele for den enkelte læge: 1) Den kan skærpe den diagnostiske proces, 2) den giver lægen nye muligheder for oversigt i en ellers uoverskuelig journal [1], derudover åbnes der muligheder for 3) kvalitetsvurdering [2] og 4) forskning. Sidstnævnte anvendelser forudsætter imidlertid, at diagnoserne anvendes på en ensartet måde, så arbejdet i forskellige lægepraksis kan sammenlignes. Kvalitet i diagnoseregistrering kan måles på validitet (den rigtige diagnose) og
reliabilitet (enigheden i diagnoseanvendelsen). Reliabilitet kan måles mellem forskellige læger (interobservatørvariationen) eller mellem de samme læger over tid (intraobservatørvariationen). Vi ved imidlertid ikke, i hvilken udstrækning forskellige læger anvender samme diagnose ved en given klinisk situation, og vi ved ikke, om lægerne vil anvende de samme diagnoser i de samme situationer fra gang til gang.

Formålet med herværende undersøgelse er at vurdere reliabilitet udtrykt som inter- og intraobservatørvariationen ved kodning med ICPC-diagnoser.

Materiale og metoder

Fyrre praktiserende læger fik i 1997 tilsendt ti skriftlige sygehistorier (vignetter) med henblik på diagnosekodning. Lægerne deltog i en større forløbsundersøgelse, hvor 40 læger gennem et år diagnosekodede alle deres kontakter med en randomiseret del af deres 70+-årige patienter [3]. Før projektet havde alle læger været på et todageskursus i kodning med ICPC-klassifikationen, og de var trænet i både de teoretiske principper for kodning og den praktiske anvendelse af klassifikationen. Under projektet var der telefonsupport, så lægerne i tiden fra kl. 08 til kl. 18 kunne få hjælp med kodningsproblemer. På undersøgelsestidspunktet havde lægerne benyttet klassifikationen i mere end ni måneder.

Vignetterne var blevet udfærdiget på baggrund af ti konsekutive konsultationer fra førsteforfatterens praksis (Fig. 1 ). Efter en rykkerskrivelse blev 39 besvarelser med diagnosekodning modtaget. Fire måneder efter første udsendelse blev de samme sygehistorier genudsendt, og lægerne blev på ny bedt om at diagnosekode vignetterne. Efter en rykkerskrivelse blev der modtaget 33 besvarelser. Lægerne var ikke vidende om, at vignetterne ville blive genudsendt. De 39 besvarelser fra den første udsendelse danner baggrund for interobservatørstudiet, og de 33 besvarelser fra læger, der havde svaret både første og anden gang, indgår i intraobservatørstudiet.

ICPC-klassifikationen [4] er opbygget med en biaksial struktur med 17 kapitler ad den ene akse. Hvert kapitel er
benævnt med et bogstav (svarende til et organsystem). På den anden akse er der syv komponenter. Komponent 1 (symptomer og klager) og komponent 7 (diagnoser/sygdomme) varierer mellem de enkelte kapitler. Komponenterne 2 til 6 er fælles og omhandler procedurer som f.eks. medicinering og henvisning. Den enkelte kode består således af et bogstav efterfulgt af et tal fra 01 til 99. Lægerne blev instrueret i at benytte et indeksbaseret søgeordssystem til at finde frem til ICPC-koden. Kodningsforeskriftens princip var at vælge diagnosen på højest mulige informationsniveau (f.eks. sygdomsdiagnose frem for symptomdiagnose, hvis det var muligt) og om muligt at nævne den tilgrundliggende lidelse.

De anvendte diagnoser blev sammenlignet på tre niveauer: 1) enkeltdiagnose 2) grupperede diagnoser og 3) ICPC-kapitler. Dannelsen af grupperede diagnoser (Tabel 1 ) skete på baggrund af anbefalinger i litteraturen [5] og ud fra kliniske overvejelser vedrørende sammenhængende sygdomsdiagnoser hos ældre. For eksempel blev det valgt at gruppere diagnoserne kronisk bronkit, astma og kronisk obstruktiv lungelidelse, idet lidelserne hos ældre ikke altid er skarpt afgrænsede over for hinanden. Endelig skete grupperingen under hensyn til, at infektioner, neoplasmer og organspecifikke lidelser ikke blev blandet.

Interobservatørvariationen blev vurderet ved procent overensstemmelse på tre niveauer: enkeltdiagnose, grupperet diagnose og ICPC-kapitel. Intraobservatørvariationen blev vurderet ved procent overensstemmelse på de tre niveauer og ved Cohns Kappaanalyse [6]. Kappaværdien udtrykker graden af den fundne overensstemmelse mellem observatørernes diagnose anvendt første gang og anden gang i forhold til en tilfældig fordeling.

Resultater
Interobservatø rvariationen

I de ti vignetter blev den hyppigst anvendte enkeltdiagnose i sygehistorierne i gennemsnit anvendt af 71% af lægerne (spændvidde 41-95% mellem de ti sygehistorier). Ved gruppering af diagnoserne steg enigheden til 84% (spændvidde 62-100%). På ICPC-kapitelniveau var enigheden 94% (spændvidde 75-100%). I Tabel 1 vises fordelingen af diagnoser, der blev anvendt af mere end 10% af lægerne i de ti vignetter.

Intraobservatørvariationen

For den samlede gruppe af læger var der kun små afvigelser i hyppigst anvendte enkeltdiagnose mellem første og anden kodning. I gennemsnit (Tabel 2 ) ændrede ca. 25% af læger dog diagnose fra første til anden gang (spændvidde 9-64%). Ved Kappaanalyse af intraobservatørvariationen for enkeltdiagnose fandtes der for de ti sygehistorier en værdi på mellem - 0,06 og 0,60. Værdien var lavest for de sygehistorier, hvor næsten alle læger anvendte samme diagnose (Tabel 2).

Diskussion

Undersøgelsen viste, at ICPC-kodningen kan bruges i almen praksis, men at der er en betydelig variation på enkeltdiagnoseniveau lægerne indbyrdes og for den samme læge over tid. En samling af de enkelte diagnoser til grupperede diagnoser eller til ICPC-kapitler medførte en væsentligt øget reliabilitet.

De ti sygehistorier var opsamlet konsekutivt i forfatterens praksis og repræsenterede således et tilfældigt udsnit af de praktiserende lægers kontakter med patienterne. Det er imidlertid et spørgsmål, om nedskrevne sygehistorier giver et retvisende billede af anvendelsen af diagnoser blandt praktiserende læger. En nedskrevet sygehistorie kan næppe afspejle de komplekse forhold (kropssprog, patientkendskab osv.), der får lægen til at vælge en diagnose. Det må antages, at korte og dermed mindre komplekse sygehistorier kan medføre en mindre variation i lægernes kodning. De fundne variationer kan således opfattes som minimumsestimater.

Der er ikke gjort forsøg på at bestemme »rigtigheden« af de anvendte diagnoser, blandt andet fordi det i realiteten er umuligt at opstille en »facitliste«. Den anvendte ICPC-klassifikation har ikke inklusions- og eksklusionskriterier ved diagnosekodningen. Diagnosekodningen repræsenterede således lægens bedste skøn ud fra hans kliniske erfaring og uddannelse i ICPC- kodning. Ved gruppering af diagnoserne bliver betydningen af inklusions- og eksklusionskriterier mindre.

Enigheden i vignetundersøgelsen om hyppigst anvendte enkeltdiagnose var i gennemsnit mere end 70%. Bensing J har
i et hollandsk studie (refereret på The Tenth WONCA Conference on Family Medicine i Singapore, den 20.-24. maj 1983) vurderet, at dette niveau er tilfredsstillende, men fastlæggelsen af niveauet synes at være arbitrær, og behovet for reproducerbarhed må afhænge af formålet med kodningen. Enkelte sygehistorier viste, at lægerne kunne være i tvivl om kodningsforeskriften for en diagnose (information på højest mulige niveau og om muligt den tilgrundliggende lidelse). Dette gælder for eksempel for sygehistorie syv (Fig. 1), som omhandlede en patient med brystsmerter, hvor nogle læger valgte diagnosen angina pectoris og andre iskæmisk hjertesygdom. I sygehistorie to, hvor en patient mødte til antikoagulationsbehandling, valgte lægerne som den tilgrundliggende lidelse at kode enten arytmia perpetua eller hjerteklaplidelse. Gruppering af diagnoserne i mere overordnede sygdomskategorier (f.eks. »hjertesygdom«) reducerede problemet væsentligt.

Kappaanalyse blev anvendt til sammenligning af lægernes kodning af samme sygehistorie med fire måneders mellemrum. Traditionelt [7] anses en kappaværdi på 0,8-1,0 at udtrykke »næsten perfekt overensstemmelse«, værdier på 0,6-0,8 »god overensstemmelse«, 0,4-0,6 »moderat overensstemmelse«, 0,2-0,4 »nogenlunde overensstemmelse«, og 0,0-0,2 »ringe overensstemmelse«. Ved høj grad af enighed om den hyppigst anvendte diagnose mellem lægerne er det imidlertid vanskeligt at opnå en høj Kappaværdi mellem første og anden kodning, idet den forventede, tilfældige overensstemmelse er høj. Kappaværdien kan derfor ikke anvendes som mål for overensstemmelsen i disse situationer.

Der findes få undersøgelser af variationen mellem lægernes brug af ICPC-diagnoser, og vi har ikke fundet andre studier, hvor man har vurderet variationen over tid for samme kliniske situation. I et sammenlignende europæisk studie [8] blev kontakten mellem læge og patient i konsultationen optaget på bånd, og henvendelsesårsagen blev af patienten registreret før og efter konsultationen. Efter konsultationen kodede lægen henvendelsesårsagerne. En anden praktiserende læge hørte båndet og kodede. Der blev fundet overensstemmelse vedrørende henvendelsesårsagerne i 84% af kontakterne, men studiet omfattede ikke lægelige diagnoser. I en australsk undersøgelse tog man udgangspunkt i 347 videooptagelser af konsultationer, som blev kodet af den konsulterende læge og efterfølgende gennemset og kodet af ICPC-trænede kolleger [5]. På kapitelniveau var der god enighed om hyppigst anvendte diagnose mellem de praktiserende læger (omkring 80%), mens der på enkeltdiagnoseniveau kun var 56% overensstemmelse. Denne overensstemmelse er lavere end den, der er fundet i vores studie, muligvis fordi videooptagede konsultationer giver et mere komplekst billede af en konsultation end en kortere skriftlig sygehistorie. Den mindre variation kan imidlertid også skyldes, at lægerne i vores undersøgelse var trænet i ICPC-kodning, og at der blev anvendt et indekseret diagnosekodningssystem, som understøttede diagnosevalget.

I Danmark er diagnosekodning med ICPC blevet vurderet af John Sahl Andersen i en ph.d.-afhandling fra 1998 [9]. Her blev 796 kontakter (378 telefonkonsultationer og 418 besøg) ved Københavns Lægevagt kodet på baggrund af det skrevne notat af projektlederen og af to andre læger, der var trænet i brug af ICPC. Enigheden mellem de tre var for hyppigst anvendte enkeltdiagnoseniveau i størrelsesordenen 75%. I herværende projekt var enigheden på enkeltdiagnoseniveau af samme størrelsesorden, og kodningen med ICPC-diagnoser blev udført af de deltagende læger direkte.

I dette studie vistes, at reliabilitet i kodningen stiger væsentligt, hvis man samler diagnoserne i grupper eller ICPC-
kapitler. Der pågår internationalt et arbejde med udvikling af ICPC til ICPC2, hvor der er inklusions- og eksklusionskriterier til den enkelte diagnose. Det bør vurderes, om kvaliteten af kodning kan fremmes ved sådanne klare kriterier for kodning.

ICPC-klassifikationen kan efter vores opfattelse anvendes til diagnosekodning i almen praksis, når lægerne har gennemgået uddannelse i kodning og er velmotiverede. For den enkelte læge giver kodningen et overblik over den enkelte patientjournal og muligheder for kvalitetsudvikling. Systematisk brug af koder kan derudover blive et uvurderligt forskningsværktøj i almen medicin.

Summary

Differences in general practitioners' use of International Classification for Primary Care diagnoses. The inter and intra observer variation

Ugeskr Læger 2003;165:4104-4107

Introduction: Some general practitioners code their patient contacts according to diagnosis. It is, however, not known to what extent different doctors use the same diagnosis in the same clinical situation, or whether the doctors use the same diagnosis next time they encounter the same clinical situation.

Material and methods: Forty general practitioners trained in coding with the International Classification for Primary Care (ICPC) used diagnosis codes on ten written case stories. Four months later the doctors were asked to code the same case stories. The inter-observer variation was determined using percentage agreement in the diagnosis coding. Diagnoses for selected disorders were grouped in advance in bigger clinical units. The intra-observer variation was determined using percentage agreement as above and by means of Kappa analysis.

Results: The inter-observer variation on single diagnosis was level 71%, by grouping the diagnoses the agreement increased to 84%, and on ICPC chapter level the agreement reached 94%. The intra-observer variation for the total group of doctors was small from first to second coding, but 25% of the doctors changed diagnosis from first to second coding.

Discussion: The study showed that ICPC coding may be used in general practice but that the variation may be considerable on single diagnosis level. Grouping of the diagnoses or use of chapter diagnoses increase the reliability considerably. The study indicates that clear criteria (inclusion and exclusion criteria) for the diagnosis coding are needed.

Henrik Schroll, Forskningsenheden for Almen Medicin, Syddansk Universitet, Winsløwparken 19, DK-5000 Odense C.
E-mail: hschroll@health.sdu.dk

Antaget den 20. juni 2003.

Syddansk Universitet, Forskningsenheden for Almen Medicin.

Forskelle i praktiserende lægers anvendelse af International Classification for Primary Care-diagnoser

Summary

Referencer