Skip to main content

Validering af spørgeskema ved lidelser i overekstremiteten

Alex Herup, Søren Merser & Michel Boeckstyns Håndkirurgisk Afsnit, Ortopædkirurgisk Afdeling, Gentofte Hospital

26. nov. 2010
12 min.


Introduktion: Disability of the arm, shoulder and hand (DASH) er et amerikansk udviklet spørgeskema, der kan anvendes på patienter med lidelser i overekstremiteten. Ud fra besvarelsen af spørgeskemaet kan der udregnes en numerisk DASH-score. Scoren kan anvendes som et udtryk for patientens opfattelse af invalideringsgraden. DASH kan anvendes på patienter med alle former for lidelser i overekstremiteten og er anvendelig både ved akutte og kroniske tilstande, hvad enten de er opstået på traumatisk vis eller ej. I denne undersøgelse er DASH anvendt på en gruppe danske patienter med forskellige overekstremitetslidelser. Formålet var at vurdere reproducerbarheden af de danske patienters DASH-scorer for at belyse, om spørgeskemaet er anvendeligt i det kliniske arbejde med danske patienter.

Materiale og metoder: Der deltog i alt 83 patienter, hvoraf 73 havde håndrelaterede lidelser, og ti havde skuldergener. De inkluderede patienter var alle i stabil sygdomsfase, typisk med kronisk lidelse, og de blev spurgt, om de ville udfylde DASH-spørgeskemaet i forbindelse med forundersøgelse inden opskrivning til operation eller ved afslutning af et behandlingsforløb i ambulatoriet.

Resultater: Der var i alt 54 patienter, der opfyldte alle krav vedrørende aflevering og besvarelse af DASH. DASH-scorene lå numerisk tæt på hinanden med en Intra Class Coefficient på 0,85. Cronbachs alfa blev udregnet til 0,96, hvilket er udtryk for, at de indgående deltest måler det samme. Spearmankoefficienten var samlet 0,9, og første og anden besvarelse var stærkt korrelerede.

Konklusion: Undersøgelsen viser god reproducerbarhed af DASH, og scoringen er stabil og pålidelig og kan anvendes på danske patienter.

DASH står for disability of the arm, shoulder and hand . Spørgeskemaet er udviklet af The Insitute of Work and Health, Toronto, Ontario, Canada og The American Academy of Orthopaedic Surgeons [1]. Det indeholder 30 spørgsmål: 21 vedrørende evnen til at udføre praktiske aktiviteter, seks vedrørende symptomer i overekstremiteterne og tre vedrørende psykosociale forhold. Endvidere er der inkluderet to valgfrie moduler med fire spørgsmål i hver. Det ene modul henvender sig til sportsfolk og udøvende kunstnere, mens det andet er et arbejdsmodul for patienter på arbejdsmarkedet. Disse valgfri moduler er ikke anvendt i denne undersøgelse. Der foreligger endvidere en kort version af spørgeskemaet, Quick DASH.

Transkulturel adaptation (dvs. valideret oversættelse) af DASH er udført til talrige sprog og kulturer: I skrivende stund er 35 adapterede versioner godkendt, og seks er under udarbejdelse. Der er fastlagt strenge krav til oversættelsesprocessen og godkendelse af skemaet på nye sprog, hvilket varetages af the Institute of Work and Health i Canada [1], som har udviklet DASH og ejer rettighederne til spørgeskemaet. I korthed omfatter processen først oversættelsen fra originalsproget til målsproget, og herefter tilbageoversættelse til originalsproget og sammenligning af tilbageoversættelsen med den originale version. I forløbet deltager forskellige grupper af både medicinsk faglige personer og sprogfaglige personer. Den danske oversættelse af DASH er blevet godkendt i 2004. Den danske oversættelse er den eneste autoriserede version, og modifikationer er ikke tilladt hverken i indhold eller udformning, da selv små ændringer kan påvirke måleegenskaberne.

Spørgsmålene i spørgeskemaet skal besvares med en værdi fra 1 til 5 (fra »ingen gene« til »værst mulig gene«). Den samlede score beregnes som [(summen af n svar/n)-1] × 25. En DASH-score må ikke udregnes, hvis der er mere end tre ubesvarede spørgsmål. Den højest mulige score (værste gene) er således 100 og den laveste 0 (ingen gener).

Scoring af de valgfrie moduler gøres efter samme formel, dog med det forbehold, at scoren ikke må udregnes, hvis der mangler besvarelser.

DASH har vist sig at være velegnet til vurdering af patienter med lidelser og symptomer fra overekstremiteterne inden for ortopædkirurgien. Specielt anvendes DASH meget i håndkirurgien, og det bruges internationalt på en bred og varieret patientgruppe. Eksempelvis patienter med karpaltunnelsyndrom [2], reumatoid artritis [3], distal radius-fraktur [4], fleksorseneskade [5], discus triangularis-skade [6], osteoartrose i hånden [7], amputationsskader [8] m.m. DASH anvendes i et mere begrænset omfang inden for skulderkirurgi [9].

Der er ved tidligere undersøgelser fundet god reproducerbarhed af scoringerne i originalsproget [10, 11].

Formålet med denne undersøgelse var primært at undersøge reproducerbarheden af DASH-spørgeskemaet som et led i den transkulturelle adaptation og sammenligne denne reproducerbarhed med originalversionen, sekundært at undersøge spørgeskemaets interne konsistens.

Materiale og metoder

Indgangskriterierne var håndrelaterede eller skulderrelaterede gener i stabil fase hos patienter, der var henvist til forundersøgelse på Ortopædkirurgisk Afdeling, Gentofte Hospital. Vi tilstræbte et materiale af en størrelse og en fordeling af diagnosegrupperne, der svarede til den originale amerikanske reproducerbarhedsundersøgelse [10].

Ved forundersøgelsen blev patienterne bedt om at udfylde spørgeskemaet uden nærmere information om reproducerbarhedsundersøgelsen for at undgå, at denne viden skulle påvirke deres senere besvarelse. En uge efter forundersøgelsen fik patienterne tilsendt et nyt spørgeskema, der nu indeholdt skriftlig information om den pågående reproducerbarhedsundersøgelse og anmodning om at indsende deres besvarelse inden for en uge i en vedlagt frankeret returkuvert. Besvarelserne blev indsamlet og data bearbejdet i et sekretariat, hvis medarbejdere ikke havde direkte kontakt med patienterne.

Patienter som ikke ønskede at udfylde skemaerne, udfyldte skemaerne mangelfuldt (dvs. mere end tre ubesvarede spørgsmål) eller indsendte deres svar mere end 31 dage efter forundersøgelsen, blev ekskluderet.

Statistik

Da formålet med undersøgelsen ikke blot var at vurdere reproducerbarheden af DASH, men særligt at undersøge om reproducerbarheden af den danske version svarede til den originale version og andre oversættelser, har vi valgt de samme statistiske test, som blev anvendt i tidligere publikationer.

Beaton anvendte i sin originalpublikation Intra Class Coefficient (ICC) model 2.1 [12], mens andre har anvendt ICC model 1.1 [13]. Begge er korrelationskoefficienter for kategoriske data, henholdsvis i en tovejs- og en envej s ANOVA-analyse. Korrelationskoefficienterne Pearson og Spearman er udtryk for sammenhængen mellem første og anden DASH-score. De indikerer således, om der er en høj første score og en høj anden score, men er ikke nødvendigvis et udtryk for, om scorene rent numerisk er identiske. Vi mener, at Spearmanmodellen til test af data på en rangordenskala er mest relevant i dette test/retest studie, men vi har supplerende udregnet Pearsons koefficient til sammenligning med andre arbejder, hvor den anvendes [10].

Udregning af kappakoefficient fravalgte vi, da den egentlige kappakoefficient er beregnet til nominelle skalaer og i øvrigt ikke er anvendt i de materialer, vi ønskede at sammenligne os med.

Til evaluering af spørgeskemaets interne konsistens har vi i lighed med andre [13-17] anvendt Cronbachs alfa [18].

Alle statistiske beregninger og grafik er lavet med open source -programmet R version 2.07, (R Development Core Team (2008)). Der er anvendt følgende R-packages :

Dataimport fra Microsoft Access-database med RODBC (oprindeligt Michael Lapsley og fra oktober 2002 Brian D. Ripley (2008)). R til LATEX2e kode med Hmisc ( Harrell, Jr. (2007)) .Cronbachs alfa med irr ( Matthias Gamer samt Jim Lemon og Ian Fellows (2007)).

Resultater

I alt indgik 83 patienter, hvoraf 73 patienter havde håndrelateret gener og ti skulderrelaterede gener. I alt 29 patienter blev sekundært ekskluderet: I otte tilfælde var besvarelsen mangelfuld, 18 skemaer var udfyldt senere end efter 31 dage, og tre angav ikke datoen. Således omfattede korrelationsanalyserne 54 tilfælde.

Diagnosekategorier i undersøgelsen fremgår af Tabel 1 .

For så vidt angår de 54 patienter, hvor en score kunne udregnes for begge besvarelser, var kun 30 ud af 3.240 mulige spørgsmål (1%) ubesvarede. Det hyppigst ubesvarede spørgsmål angik patienternes sexliv og udgjorde 20% af de ubesvarede spørgsmål. De øvrige manglende svar var jævnt fordelt på de øvrige spørgsmål.

Figur 1 viser den lineære korrelation mellem DASH-scorene for skema 1 og skema 2.

For de 54 patienter, der indgik i de statistiske beregninger, var ICC-værdierne 0,85, både ved anvendelse af envejs- og af tovejsanalysemodellen. Pearson- og Spearmankoefficienterne var henholdsvis på 0,89 og 0,90. Cronbachs alfa var på 0,96.

Diskussion

Reproducerbarheden af DASH-scoringerne i vores undersøgelse havde en ICC-værdi på 0,85, både ved anvendelse af en envejs- og en tovejsmodel.

Reproducerbarhed bedømmes som værende »moderat god«, hvis ICC-værdierne er mellem 0,4 og 0,75 og »meget god" ved værdier over 0,75 [19].

Vores undersøgelsesresultat viser således »meget god« overensstemmelse. Næsten identiske værdier er fundet i andre arbejder [15, 16].

Nogle materialer angiver ICC-værdier, der ligger noget højere end vores [14, 20]. Dette gælder også originalmaterialet [10] med en værdi på 0,96. Forskellen er dog ikke større, end at reproducerbarheden i vores materiale må anses for at være af samme størrelsesorden som i den oprindelige DASH.

Den stærke korrelation bekræftes af Spearman- og Pearsonkoefficienterne, som var næsten identiske på 0,89 og 0,90, og de bekræfter således begge den stærke korrelation. Cronbachs alfa angiver en meget høj intern konsistens, der svarer til andre undersøgelser [13-17]. Den jævne spredning af scorene, som fremgår af Figur 1, viser endvidere, at spørgeskemaet for det første har en god diskriminativ evne (evne til at skelne patienter med få symptomer fra patienter med flere symptomer) og for det andet, at reproducerbarheden ikke er afhængig af værdien af selve scoren: Besvarelserne fra såvel patienter med lav score som fra patienter med høj score var korrelerede. Endelig viser spredningen af scorene, at vores materiale havde en bred fordeling og således repræsenterede et bredt symptomsværhedsspektrum.

Antallet af frafaldne respondenter i denne undersøgelse er højt, men skal imidlertid vurderes på baggrund af undersøgelsens design, hvor der ikke forelå en forhåndsaccept fra patienternes side, og hvor der ingen direkte patientkontakt var ved anden besvarelse. Det var således op til patienterne selv, om de fandt det vigtigt at deltage og overholde tidsfristen. Disse forhold var uundgåelige for at mindske biaspåvirkningen mellem første og anden besvarelse, og vi vurderer, at størrelsen af materialet - trods eksklusionerne - er acceptabelt til vurdering af reproducerbarheden og sammenligningen med andre materialer. Især finder vi det vigtigt, at kun 10% måtte ekskluderes på grund af mangelfuld besvarelse. Det er tidligere blevet diskuteret, hvorvidt spørgsmålet vedrørende patienternes evne til at dyrke sex burde udgå, men man har valgt at beholde spørgsmålet og dette må respekteres for ikke at påvirke spørgeskemaets validitet i forhold til udenlandske versioner, således at sammenlignelighed er mulig. Set ud fra et reproducerbarhedssynspunkt mener vi, at den danske oversættelse af DASH er korrekt, idet reproducerbarheden af den danske oversættelse er god ved sammenligning med den oprindelige version.

Hvad angår intervallets længde mellem første og anden besvarelse har vi på forhånd valgt 31 dage som maksimum for at mindske risikoen for variationer, der kan tilskrives reelle ændringer i selve sygdommens forløb. Tidligere er det dog påvist, at det ikke er af afgørende betydning, om der er et kort eller langt tidsinterval mellem test/retest-tidspunkterne for DASH [14], og dette kan vores undersøgelse bekræfte, idet vi fandt ICC-værdier på 0,85 for den endelige gruppe på 54 patienter og en ICC-værdi på 0,87, når også de tilfælde inkluderes, hvor tidsfristen blev overskredet.

Konklusion

Vores udregninger bekræfter, at der er god overensstemmelse mellem patienternes scoring ved første og anden besvarelse af DASH-spørgeskemaet, og at overensstemmelsen er af samme størrelsesorden, som den der blev opnået i den originale version, hvilket bekræfter den transkulturelle adaptations validitet.

Desuden påvises en god intern konsistens i spørgeskemaet.

Overordnet viser DASH-scoren sig derfor som stabil, valid og derfor velegnet til evaluering både i klinikken og i videnskabelige undersøgelser.


Summary

Validation of questionnaire for conditions of the upper extremity

Ugeskr Læger 2010;172(48):3333-3336

Introduction: DASH stands for Disability of the Arm, Shoulder and Hand and is a questionnaire developed in the US that can be used for assessment of patients with disability in the upper extremities. On the basis of the answers provided, a numerical DASH score can be calculated that reflects the patient's subjective evaluation of his or her disability. DASH would be of use for all upper-limb disorders and is appropriate for both acute and chronic disorders of either traumatic or non-traumatic aetiology. We present a study in which DASH has been used in a group of patients with a variety of conditions in the upper extremity. The aim was to evaluate the reproducibility of the scoring of Danish patients and to evaluate whe ther the questionnaire was useful in Danish clinical practice.

Material and methods: A total of 83 patients joined the study, 73 of these with hand-related conditions and ten with shoulder problems. The patients included were all in a stable stage of their disease, which typically was chronic, and they were invited to answer the questionnaire in connection with a medical examination preceding surgery or at the final ambulatory visit after treatment had been given.

Results: A total of 54 of the patients met all criteria concerning delays and responsiveness. The DASH scores of the first and second test were numerically close with an intra-class coefficient of 0.85. Cronbach's alpha was 0.96, indicating that the subtests were internally consistent. Spearman's correlation coefficient was overall 0.9 and, thus, there was a strong correlation between the first and the second response.

Conclusion: The study reveals a good reproducibility of the DASH questionnaire. DASH scoring is stable and reliable and useful in a Danish patient population.


Alex Herup , Hvedevej 6, 2765 Smørum. E-mail: al.herup@sport.dk

Antaget: 23. januar 2010

Først på nettet: 14. juni 2010

Interessekonflikter: Ingen




Referencer

  1. Solay S, Beaton DE, McConnell S et al. DASH outcome measure user's manual. 2. ed. Toronto: Institute for Work & Health, 2002.
  2. Hobby JL, Watts C, Elliot D. Validity and responsiveness of the patient evaluation measure as an outcome measure for carpal tunnel syndrome. J Hand Surg (Br) 2005;30:350-4.
  3. Chiari-Grisar C, Koller U, Stamm TA et al. Performance of the disabilities of the arm, shoulder and hand outcome questionnaire and the Moberg picking up test in patients with finger joint arthroplasty. Arch Phys Med Rehabil 2006;87:203-6.
  4. Keller M, Steiger R. [Open reduction and internal fixation of distal radius extension fractures in women over 60 years of age with the dorsal radius plate (pi-plate)]. Handchir Mikrochir Plast Chir 2006;38:82-9.
  5. Su BW, Solomons M, Barrow A et al. Device for zone-II flexor tendon repair. A multicenter, randomized, blinded, clinical trial. J Bone Joint Surg Am 2005;87:923-35.
  6. Ruch DS, Papadonikolakis A. Arthroscopically assisted repair of peripheral triangular fibrocartilage complex tears: factors affecting outcome. Arthroscopy 2005;21:1126-30.
  7. De Smet L. Responsiveness of the DASH score in surgically treated basal joint arthritis of the thumb: preliminary results. Clin Rheumatol 2004;23:223-4.
  8. Davidson J. A comparison of upper limb amputees and patients with upper limb injuries using the Disability of the Arm, Shoulder and Hand (DASH). Disabil Rehabil 2004;26:917-23.
  9. Bengtsson M, Lunsjo K, Hermodsson Y et al. High patient satisfaction after arthroscopic subacromial decompression for shoulder impingement: a prospective study of 50 patients. Acta Orthop 2006;77:138-42.
  10. Beaton DE, Katz JN, Fossel AH et al. Measuring the whole or the parts? Validity, reliability, and responsiveness of the Disabilities of the Arm, Shoulder and Hand outcome measure in different regions of the upper extremity. J Hand Ther 2001;14:128-46.
  11. Turchin DC, Beaton DE, Richards RR. Validity of observer-based aggregate scoring systems as descriptors of elbow pain, function, and disability. J Bone Joint Surg Am 1998;80:154-62.
  12. Shrout PE, Fleiss JL. Intraclass correlations: uses in assessing rater reliability. Psychol Bull 1979;86:420-8.
  13. Lee EW, Lau JS, Chung MM et al. Evaluation of the Chinese version of the Disability of the Arm, Shoulder and Hand (DASH-HKPWH): cross-cultural adaptation process, internal consistency and reliability study. J Hand Ther 2004;17:417-23.
  14. Atroshi I, Gummesson C, Andersson B et al. The disabilities of the arm, shoulder and hand (DASH) outcome questionnaire: reliability and validity of the Swedish version evaluated in 176 patients. Acta Orthop Scand 2000;71:613-8.
  15. Imaeda T, Toh S, Nakao Y et al. Validation of the Japanese Society for Surgery of the Hand version of the Disability of the Arm, Shoulder, and Hand questionnaire. J Orthop Sci 2005;10:353-9.
  16. Padua R, Padua L, Ceccarelli E et al. Italian version of the Disability of the Arm, Shoulder and Hand (DASH) questionnaire. Cross-cultural adaptation and validation. J Hand Surg (Br) 2003;28:179-86.
  17. Themistocleous GS, Goudelis G, Kyrou I et al. Translation into Greek, cross-cultural adaptation and validation of the Disabilities of the Arm, Shoulder, and Hand Questionnaire (DASH). J Hand Ther 2006;19:350-7.
  18. Cronbach L. Coefficient alpha and the internal structure of tests. Psychometrika 1951;16:297-334.
  19. Rankin G, Stokes M. Reliability of assessment tools in rehabilitation: an illustration of appropriate statistical analyses. Clin Rehabil 1998;12:187-99.
  20. Orfale AG, Araujo PM, Ferraz MB et al. Translation into Brazilian Portuguese, cultural adaptation and evaluation of the reliability of the Disabilities of the Arm, Shoulder and Hand Questionnaire. Braz J Med Biol Res 2005;38:293-302.