Kvalitetsovervågning af sundhedsvæsenets ydelser får i disse år en tiltagende sundhedsfaglig og politisk betydning. I de landsdækkende kliniske databaser (LKD) findes en uudnyttet guldgrube af oplysninger, som potentielt kan medføre bedre behandling til gavn for patienterne samt bedre resurseudnyttelse [1].
I Danmark er i alt 34 LKD tilknyttet de tre nationale kompetencecentre og otte LKD er tilknyttet det Nationale Indikatorprojekt (NIP). Endvidere findes der LKD, som er tilknyttet Sundhedsstyrelsen.
Det er et basiskrav til LKD, at der anvendes anerkendte statistiske og epidemiologiske principper i forbindelse med analysen af data, og at der forud for offentliggørelse skal ske en faglig fortolkning af data [2]. Der er imidlertid hverken nationalt eller internationalt enighed om, hvordan data skal analyseres og transformeres til brugbar sundhedsfaglig information [3]. Det har også vist sig, at de kvalitetsdata, som faktisk er til rådighed for afdelingerne, kun i beskedent omfang anvendes systematisk til kvalitetsudvikling, og at dette hænger sammen med manglende udnyttelse af mulighederne for let tilgængelig statistisk proceskontrol [4].
Formålet med denne statusartikel er at beskrive de grundliggende principper ved analysen, fortolkningen og formidlingen af landsdækkende kvalitetsdata, som anvendes af Enhed for Klinisk Kvalitet i Region Hovedstaden (EKK), herunder at demonstrere hvordan data kan præsenteres i en visuel, forståelig form, som ikke kræver en dybtgående statistisk indsigt. Hermed kan f.eks. sygehusledelser, politikere og patienter, som i stigende grad efterspørger disse oplysninger, forholde sig til resultaterne.
Dataindhentning
Danmark er internationalt kendt for at have nogle af verdens bedste registre til sundhedsvidenskabelig og epidemiologisk forskning. Som supplement til disse registre har vi nu også data fra de LKD, hvis datakvalitet for nogle databasers vedkommende overstiger kvaliteten i både Landspatientregistret (LPR) og Cancerregistret [5]. De fleste databaser benytter i dag det webbaserede Klinisk Måle System (KMS) til indberetninger. Andre databaser indhenter data fra f.eks. de patientadministrative systemer eller fra LPR.
Tolkning og analyse af data i analyseportalen - statistisk proceskontrol
Hovedformålet med at indsamle, analysere og præsentere kvalitetsdata er dels at måle, om kvaliteten har det ønskede niveau, og dels løbende at følge ændringer i kvaliteten. Hermed kan der identificeres faktorer, som påvirker kvaliteten, så den løbende kan forbedres. For at opdage kvalitetsændringer så tidligt som muligt og kunne skelne tilfældige og uundgåelige udsving i kvaliteten fra reelle ændringer, som der bør handles på, anvendes statistisk proceskontrol.
Den metode til statistisk proceskontrol, som anvendes af EKK, er inspireret af de kontrolkort, som Walter A. Shewhar t udviklede i 1924 til brug for kvalitetsstyring i telefonindustrien [6], og som siden har opnået stor udbredelse i mange brancher. Ideen er, at værdien af en indikator måles med faste tidsintervaller (f.eks. hver måned eller kvartalsvist) og registreres i et koordinatsystem som en funktion af tid, hvorved det bliver muligt enkelt og visuelt at identificere de ændringer, som ikke skyldes stokastisk variation [7, 8].
EKK præsenterer kvalitetsdata i form af indikatorrapporter i et webbaseret rapporteringssystem, Analyseportalen (AP). AP er et SAS-baseret rapporteringsværktøj, som tilbydes databaser, der drives af Kompetencecenter Øst. I AP har brugeren via internettet adgang til alle data fra egen afdeling. AP opdateres en gang i døgnet.
Ud over kontrolkort viser indikatorrapporterne sammenligningsdiagrammer og rangstillingsdiagrammer, hvor afdelingerne kan se egne værdier sammenlignet med værdierne for afdelingerne i resten af landet. Indikatorrapporterne indeholder desuden tabeller og grafer, som belyser datakvaliteten.
Der findes forskellige typer kontrolkort, hvis anvendelse er behandlet i en særskilt artikel [9]. I AP findes en række forskellige rapportmuligheder (Figur 1 ). I kontroldiagrammerne sammenlignes afdelingens resultater i en periode med afdelingens gennemsnit med angivne kontrolgrænser (Figur 2 ). I sammenligningsdiagrammerne kan man sammenligne udviklingen af afdelingens indikatorværdi over tid med den tilsvarende udvikling i middelværdien for de øvrige afdelinger, som deltager i databasen (Figur 3 ). I rangstillingsdiagrammerne er indikatorværdierne på et bestemt tidspunkt rangstillet for alle afdelinger, som deltager i databasen (Figur 4 ).
Tolkning af forskelle i kvalitet
Overordnet bør fire forhold vurderes ved stillingtagen til, om en målt variation i kvaliteten er reel (Figur 5 ).
1) Er der tale om en skæv eller inkomplet udvælgelse af data (bias)?
Selektionsbias opstår, når der sker en systematisk selektion ved udvælgelse af patienter, så den patientgruppe, man undersøger, ikke er repræsentativ for den population, man observerer.
Der bør derfor foreligge en kvalificeret stillingtagen til, hvilke patienter der indgår, samt databasens dækningsgrad og databasekomplethed [10].
-
Dækningsgraden er defineret som antallet af patienter, der er indberettet til databasen, i forhold til samtlige patienter, der opfylder inklusionskriterierne. Den acceptable grænse for dækningsgraden er af Danske Regioner (DR) og Sundhedsstyrelsen (SST) sat til 90%.
-
Datakompletheden er defineret som antallet af oplysninger, der indberettes pr. patient, i forhold til samtlige oplysninger, der ønskes indberettet pr. patient. Den acceptable datakomplethed er af DR og SST sat til 80%.
Selv om en afdeling indrapporterer 90% af sine patienter, kan opgørelse af kvaliteten være værdiløs, hvis det er de manglende 10%, som har været udsat for komplikationer. De in dsamlede data bør således principielt offentliggøres med evt. mangler bl.a. for at skabe fokus på disse. En lav indberetningsfrekvens giver ikke nødvendigvis en fejlagtig måling, men det vil i praksis være vanskeligt at vurdere, i hvilken grad de ikkeindberettede patienter adskiller sig fra de indberettede.
Redegørelse for dækningsgraden og datakomplethed kan tilvejebringes forskelligt afhængigt af dataindsamlingsmetode samt af, hvilke andre registrer, der samkøres med.
I en undersøgelse fra Danske Regioner blev 26 LKD'ers dækningsgrad og datakomplethed belyst [10]. Undersøgelsen viste, at der var syv databaser med fuldkommen dataindsamling, 18 databaser med ufuldkommen dataindsamling, mens en database var under etablering. En database blev defineret til at have fuldkommen dataindsamling, hvis samtlige afdelinger havde en dækningsgrad på mindst 90% samt en datakomplethed på mindst 80%. Databaserne blev vurderet ud fra samme kriterier på trods af forskelle i de anvendte datakilder. Benytter en database udelukkende LPR-data, vil der sjældent være et andet register at referere op imod, og dækningsgraden kan ikke umiddelbart beregnes. Dette i modsætning til de KMS-baserede databaser, der benytter LPR som reference.
2) Er der tale om tilfældige forskelle mellem afdelingerne?
For at en forskel skal være klinisk meningsfuld, skal den have en vis størrelse, og den må ikke kunne tilskrives tilfældigheder. Sandsynligheden for, at tilfældigheder ligger til grund for en forskel, skal være mindre end 5%. Ved f.eks. et 5%-signifikansniveau vil der være signifikante afvigelser på hver 20. afdeling, uden at der nødvendigvis reelt er tale om en forskel i kvaliteten. Dette problem kan reduceres ved at sænke signifikansniveauet til 1%, men derved overses en række reelle forskelle. Det er derfor nødvendigt at kommentere den statistiske usikkerhed ved præsentationen af kvalitetsdata, f.eks. ved angivelse af konfidensintervaller.
3) Er resultaterne tidsmæssigt konsistente?
Hvis den samme afdeling gentagne gange afviger i kvalitet i forhold til andre afdelinger, er der lille sandsynlighed for, at afvigelselsen kan tilskrives statistiske tilfældigheder. Afviger en afdeling kun et enkelt år, bør man være påpasselig med for faste konklusioner, uanset om disse udsving er signifikante. Resultater, som er væsentligt forskellige fra det forventede, bør føre til audit.
4) Kan forskelle mellem afdelingerne forklares ved konfounding?
Ved måling af proces- eller strukturindikatorer er det ikke meningsfuldt at risikojustere. Når derimod resultatindikatorer skal vurderes (f.eks. 30-dages-mortalitet), bør patientgrundlagene mellem afdelingerne være sammenlignelige, og der bør justeres for risikofaktorer, der kan være en medvirkende årsag til forskelle i resultaterne.
Hvis forskellen i kvalitet mellem afdelinger forsvinder efter stratificering eller justering for en eller flere konfoundere, kan det konkluderes, at forskellen primært kan tilskrives forskelle i patientgrundlaget. Det er et vigtigt budskab til den pågældende afdeling og væsentligt for forståelsen af baggrunden for kvaliteten.
I praksis er informationen om en eller flere risikofaktorer ofte ufuldstændig eller unøjagtig. Flere nationale cancerdatabaser har haft ønske om en risikojustering på bl.a. overlevelsesdata, men har indtil videre stort set måtte opgive dette ønske på grund af utilstrækkelig registrering af livsstilsfaktorer og konkurrerende sygdomme, som ikke tillod statistisk forsvarlig justering i deres patientpopulationer.
Videre er der i praksis grænser for korrektion for konfounding, selv om alle relevante data er indhentet. Det skyldes, at kontrol for eller stratifikation efter en given konfounder kræver en datamængde af en vis størrelse.
Der bør vises ydmyghed med hensyn til de muligheder, man reelt har for at korrigere for skævheder, når datagrundlaget er mangelfuldt. Ydmygheden bør afspejle sig ved formidlingen af kvalitetsdata.
Diskussion
Data, der indsamles i de LKD, anvendes ikke til kvalitetsudvikling i det omfang, de potentielt kunne. En del af forklaringen er it-problemer, manglende uddannelse i at anvende rapporteringssystemerne og manglende ledelsesinvolvering [4]. Det har nok også betydning, at kvalitetsmonitorering er et relativt nyt fænomen i sundhedsvæsenet, som kræver adfærdsændring og skaber skepsis i en kultur, der ikke har været vant til at blive målt. Med denne artikel har vi ønsket at gøre opmærksom på, at det er muligt at præsentere kvalitetsdata i en visuel, forståelig form, som er troværdig, men ikke kræver dybtgående statistisk indsigt, samt at påpege en række elementære faldgruber ved stillingtagen til, om en målt kvalitetsforskel er reel.
Det foreslås derfor, at man på landsplan (kompetencecentrene, NIP og SST) søger at opnå enighed om en fælles skabelon for analyse og præsentationsform, så formidlingen af data til såvel klinikere som til den brede offentlighed forbedres og gøres entydig.
Jan Utzon , Enhed for Klinisk Kvalitet, Region Hovedstaden, Bispebjerg Hospital, DK-2400 København NV. E-mail: janutzon@dadlnet.dk
Antaget: 13. marts 2009
Interessekonflikter: Ingen
Summary
Summary Analysis of quality data based on national clinical databases Ugeskr Læger 2009;171(38):2723-2727 There is little agreement on the philosophy of measuring clinical quality in health care. How data should be analyzed and transformed to healthcare information is an ongoing discussion. To accept a difference in quality between health departments as a real difference, one should consider to which extent the selection of patients, random variation, confounding and inconsistency may have influenced results. The aim of this article is to summarize aspects of clinical healthcare data analyses provided from the national clinical quality databases and to show how data may be presented in a way which is understandable to readers without specialised knowledge of statistics.
Referencer
- Utzon J, Hansen CC, Andreasen J et al. Dansk Hysterektomi Database set i et sundhedsøkonomisk perspektiv. Ugeskr Læger 2005;167:3170-4.
- Basiskrav for landsdækkende kliniske kvalitetsdatabaser. Notat fra Danske Regioner 11-05-2007. Dokumentnr. 6604/07.
- Loeb JM. The current state of performance measurement in health care. Int J Qual Health Care 2004;16:5-9.
- Kliniske kvalitetsdatabaser - af navn eller af gavn? Lundgreen A, Hesselbo B, Roesbjerg T. Ålborg: Aalborg Universitet, 2008.
- Samlet rapport. Projekt vedrørende datakvalitet i Landspatientregistret. December 2004. København: Sundhedsstyrelsen, Sundhedsplanlægningen, 2004.
- Shewhart WA. Economic control of quality of manufactured product. New York: D Van Nostrand Company, 1931.
- Lloyd R. Quality health care A guide to developing and using indicators. Massachusetts: Jones and Bartlett Publishers, 2004.
- Klinisk kvalitetsstyring I H:S. København: H:S Direktionen, 2003.
- Kontrolkort - et nyttigt grafisk redskab til analyse af processers variation over tid. Andersen SE, Kjærgaard J. Ugeskr Læger 2009;171(11):895.
- Undersøgelse af de kliniske databasers dækningsgrad. Notat til Regionssundhedsdirektørkredsen 01-10-2007 fra Danske Regioner. Dokumentnr. 55278/07.