Skip to main content

Kriterievalidering af Roland Morris-spørgeskemaet

Fysioterapeut, MPH Hanne B. Albert, fysioterapeut Anne-Mette Jensen, fysioterapeut Dorte Dahl & fysioterapeut Mette Nørbo Rasmussen

1. nov. 2005
12 min.


Introduktion: Patienter vurderer ofte behandlingssucces ud fra evnen til at klare dagligdagens gøremål, funktionsniveauet. Det er derfor i kliniske såvel som i forskningsmæssige sammenhænge nødvendigt at benytte en valid målemetode til vurdering af dette. Roland Morris Questionnaire (RMQ) er et internationalt anerkendt instrument til vurdering af funktionsniveau hos patienter med lænderygsmerter og eventuel radikulære smerter. Formålet var at kriterievalidere en dansk udgave af RMQ og sammenligne den med den fysiske funktionsdel af et dansk funktions- og smerteskema, Low Back Pain Rating Scale (RS) samt den fysiske funktionsdel af et generelt skema, SF-36.

Materiale og metoder: Der blev foretaget retroversion af RMQ af tre professionelle oversættere uafhængigt af hinanden. RMQ, RS og SF-36 blev udfyldt af 135 patienter, der var blevet opereret for lumbal diskusprolaps, 47% kvinder, 53% mænd, gennemsnitsalder 43 år.

Resultater: Der sås en statistisk signifikant korrelation mellem RMQ og de to andre skemaer (RMQ-RS; r = 0,89, p ≤ 0,001; RMQ-PF (SF-36); r = -0,88 p ≤ 0,001). Differenserne var jævnt fordelt omkring gennemsnit, placeret uafhængigt af niveau samt inden for 95% limits of agreement. Chronback alpha på 0,94 (skala 0-1).

Diskussion: Konklusionen på studiet var, at den danske oversættelse af RMQ er et kriterievalidt instrument til måling af funktionsniveau hos patienter med lænderygbesvær og tidligere lumbal diskusprolaps. Da skemaet er hurtigt
at udfylde, kriterievalidt, har vist sig at være reliabelt internationalt, sensitivt samt hyppigt benyttet, vil vi anbefale skemaet som et supplement til den kliniske undersøgelse.



Lænderygbesvær med den komplicerende faktor diskusprolaps er et af de største sundhedsmæssige problemer. Årligt behandles der i Danmark ca. 10.000 patienter med lumbal diskusprolaps (1). Symptomerne hos patienter med diskusprolaps har flere fællesnævnere, mens smerteoplevelse og funktionelle begrænsninger er meget individuelle. Der findes således ingen lineær sammenhæng mellem prolapsens omfang og lokalisering, de kliniske symptomer og graden af funktionsindskrænkning (2-5).

En patients subjektive vurdering af en sygdoms omfang er ofte beskrevet ud fra de funktionelle begrænsninger, patienten oplever i dagligdagen. Derfor er det, ud over den kliniske undersøgelse, relevant også at inddrage et mål for patientens subjektive opfattelse af eget funktionsniveau. Flere spørgeskemaer er blevet udviklet til vurdering af lænderygpatienters funktionsniveau, og flere mener, at netop spørgeskemaer er den bedste indikator til at vise den reelle sværhedsgrad af rygsmerter (4-9).

I Danmark findes der kun få instrumenter til måling af funktionsniveauet hos patienter med lænderygbesvær, og kun et er blevet valideret (9). I DanskDiscusBase anvendes skemaet Low Back Pain Rating Scale = RS. Internationalt er det især Roland-Morris Questionnaire (RMQ) og Oswestry Questionaire, der benyttes. Begge skemaer er blevet undersøgt flere gange for reliabilitet, validitet og sensitivitet over for ændringer. I flere undersøgelser anbefaler man RMQ, da den fremviser de bedste værdier for reliabilitet, validitet og sensitivitet, er nem at udfylde og er sygdomsspecifik til patienter med lændesmerter og iskias (4-7, 10-13).

RMQ blev oprindelig udviklet i 1982 af Martin Roland og Richard Morris (6). I 1995 blev skemaet modificeret således, at også patienter med iskiassmerter blev omfattet af spørgsmålene. I denne undersøgelse blev der anvendt den modificerede udgave, der består af 23 udsagn (Bilag 1 ). Hvert spørgsmål kan besvares med ja eller nej, alt efter om udsagnet passer på patienten. Hvert ja-svar giver 1 point, og skalaen går derfor fra 0 til 23, hvor 0 er ingen funktionsnedsættelse og 23 er voldsom reduktion af funktionsniveauet. Formålet med undersøgelsen var at foretage en konvergent kriterievalidering af en dansk oversættelse af RMQ i forhold til Low Back Pain Rating Scale og fysisk funktionsskalaen fra SF-36.



Materiale og metoder

Oversættelsen af RMQ forgik i samarbejde med to uafhængige korrespondenter med certifikat i LSP (engelsk, tysk og spansk). Den ene oversatte skemaet til dansk, hvorefter den anden tilbageoversatte skemaet til engelsk. Tilbageoversættelsen blev sammenlignet med den originale RMQ for eventuelle forståelsesmæssige afvigelser. I samarbejde med en cand.mag. blev skemaet rettet til grammatisk.

Den danske oversættelse blev derefter afprøvet ved et pilotprojekt på Sygehus Fyn Ringe. Pilotprojektet havde til formål at afprøve et skema med praktiske oplysninger og den første danske version af RMQ. I pilotprojektet indgik otte kroniske rygpatienter, der gennemsnitlig anvendte 14 min til at udfylde materialet. Herefter blev der gennemført et struktureret interview til belysning af evt. uklarheder, forståelsesproblemer, irrelevante og ubehagelige spørgsmål i spørgeskemaet. På baggrund af de otte pilotprojektpatienters respons blev der foretaget mindre formuleringsmæssige rettelser, og derved blev den endelige danske version udviklet.

RMQ, RS, SF-36 og et skema med standardoplysninger blev udsendt til 251 patienter, der var opereret for lumbal diskusprolaps eller stod på venteliste til operation på Vejle Sygehus, Silkeborg Sygehus og Centralsygehuset Esbjerg Varde.

SF-36 måler generel helbredsstatus ud fra otte uafhængige skalaer. I dette projekt anvendes skalaen fysisk funktion (physical function [PF]), som indeholder ti spørgsmål, der besvares med meget begrænset, lidt begrænset og ikke begrænset. RS indeholder to uafhængige skalaer, en ren smerteskala, der måler ryg og bensmerter, og en funktionsskala, der indeholder 15 spørgsmål, som kan besvares med ja, nej, kan give problemer eller ved ikke. Spørgsmålene omhandler rygsmerternes indflydelse på patientens funktionsniveau. Svarene summeres til en score fra 0 til 30, hvor talværdien beskriver et mål fo r patientens funktionsniveau inden for de sidste 14 dage; 0 er ingen funktionspåvirkning og 30 er maksimal funktionspåvirkning. I denne undersøgelse er udelukkende benyttet funktionsskalaen.

I alt returnerede 147 patienter spørgeskemaet. Dette svarer til en svarprocent på 59%. Fordelt på sygehusene var svarprocenterne: Vejle: 56, Silkeborg: 74 og Esbjerg: 56. Der blev ekskluderet 12 sæt skemaer, fem pga. alder og syv pga. andre alvorlige tilstødende sygdomme. Den endelige undersøgelsesgruppe bestod således af 135 personer i alderen 20-67 år, heraf var der 70 mænd og 62 kvinder. Tre deltagere havde ikke angivet køn. Kønsfordelingen svarer til normalen for patienter med diskusprolaps (1). I beregninger, hvor SF-36 indgik, blev der pga. utilstrækkelig besvarelse udelukket ni patienter. Af samme årsag blev to patienter udelukket i beregninger med RS. Alle havde fuldt besvaret RMQ.

Statistik

Til kriterievaliditetsberegningen blev der benyttet to metoder: Pearsons test og et differensplot. Pearsons test beskriver den umiddelbare sammenhæng mellem de to målinger. Differensplottet illustrerer, hvor stor forskel der er mellem metoderne. Ved anvendelse af differensplottet har de to forskellige målemetoder normalt den samme måleenhed og skala, f.eks. blodtryk (14, 15). For at opnå samme scoringsskala i skemaerne er forsøgspersonernes score omregnet til procent af den maksimale score på den respektive måleskala. For at kunne udregne limits of agreement er det et krav, at differenserne er normalfordelte.

Chronbach alpha er et udtryk for, om alle spørgsmålene bidrager til at måle den latente variabel, nemlig funktionsniveau, det vil sige, at man måler den interne sammenhæng mellem spørgsmålene. Hvis værdien er lav, kan det være et udtryk for, at et eller flere af spørgsmålene ikke måler den variabel, som skemaet er designet til at måle. Hvis værdien er høj, bidrager alle spørgsmål, hvis værdien er lav, måler spøgeskemaet forskellige variable. Minimumsværdien for spørgeskemaer er 0,7.

For at vurdere betydningen af de enkelte spørgsmåls indflydelse på den totale RMQ-score er der udført følgende simple grafiske fremstilling (Fig. 1 ) . En sådan simpel fremstilling er mulig, fordi RMQ har ja/nej-svar. Patienterne blev delt i seks grupper ud fra deres samlede funktionsscore (0-3, 4-7, 8-11, 12-15, 16-19, 20-23 point). Kurverne (Fig. 1) viser, hvor mange der har sagt ja til netop dette spørgsmål for hvert af de 23 spørgsmål. For hvert spørgsmål vedrørende den underliggende variabel (funktionsniveau) forventer vi en stigende kurve (med stigende sumscore). Hvis et spørgsmål vedrører noget andet end den underliggende variabel, forventer vi en flad/næsten vandret kurve. Man kan betragte disse kurver som en visuel faktoranalyse.

Resultater

Der fandtes en højsignifikant korrelation mellem alle tre skemaer (p < 0,001). Korrelationskoefficienten ved RMQ-RS: r = 0,89 (n = 133). RMQ-fysisk funktion (SF-36): r = -0,88 (n = 126). RS-SF-36: r = -0,90 (n = 124).

Differenserne mellem RMQ og RS samt mellem RMQ og PF er normalfordelte. I begge sammenligninger er mere end 95% af målingerne placeret inden for 95% limits of agreement (Fig. 2 ). Begge differensplot er på et nogenlunde konstant niveau, men der ses en meget svag stigning fra de lave værdier til de højere værdier. Dette sammenholdt med at den gennemsnitlige differens er ca. ti procentpoint (RMQ-RS = 9,9 procentpoint og RMQ-PF = 11,6 procentpoint), hvilket vil sige, at når scoreintervallerne er omformateret til en 0-100 skala, ligger en patients score gennemsnitlig ti procentpoint højere på RMQ end på RS og PF (SF-36). Der er en acceptabel homogen varians.

Chronback alpha er på 0,94 (skala 0-1). Dette viser, at der er en meget god intern sammenhæng mellem spørgsmålene, og at hvert spørgsmål bidrager til scoringen.

Sammenlignes de 23 kurver (Fig. 2), ser man, at generelt stiger alle jævnt med højere total score, ingen er helt flade på en bestemt værdi, og ingen har modsat hældning. Dette er et udtryk for, at alle spørgsmål i RMQ vedrører den samme underliggende variabel. Enkelte kurver varierer fra der jævnt stigende mønster, hvor spørgsmål nr. 2 + 16 og 19 er de tre ekstremer. Hvor der ikke skal meget funktionshæmning til, at patienten svarer ja på spørgsmål 2 og 16, så skal patienten være næsten totalt invalideret, før end der svares ja på spørgsmål 19. Dette diskvalificerer ikke de nævnte spørgsmål, men er netop RMQ's styrke, at den spænder meget vidt og er positiv ved selv en meget begrænset funktionspåvirkning og først udtrykker en topscore, når patienten er ekstrem dårlig.

De lidt ujævne knæk, der er på visse af kurverne omkring gruppe 2-3 (8-11,12-15 point), skyldes sandsynligvis, at gruppe 3 er meget mindre end de andre grupper (Fig. 3 ).

Diskussion

Resultatet af denne undersøgelse viste, at den oversatte danske version af RMQ er kriterievalid i en dansk befolkning sammenlignet med RS og SF-36.

For at sikre RMQ's kriterievaliditet blev spørgeskemaet vurderet op imod to forskellige danske skemaer. RS blev anvendt som et sygdomsspecifikt sammenligningsgrundlag, da de to skemaer formodedes at måle samme fænomen, nemlig funktionsændringer hos patienter med lænderygbesvær og eventuelt iskias. Resultatet viste en højsignifikant korrelation mellem RMQ og RS r = 0,89. Der er kun publiceret få artikler om RS, og kun en enkelt omhandler validering af dette skema (9). Efter denne (9) validering er der udformet en modificeret udgave, hvor nogle spørgsmål har fået ændret ordlyd, andre er erstattet med nye og desuden er der tilføjet svarmuligheden »ved ikke«. At anvende RS som sammenligningsgrundlag må siges at være en mulig fejlkilde, da RS ikke er blevet genvalideret efter de ovenstående ændringer. Eftersom RS er basis i Dansk DiscusBase, som ligger til grund for danske data, vurderede vi, at skemaet kunne betragtes som det bedst tænkelige sammenligningsgrundlag i Danmark.

På grund af den manglende revalidering af RS valgte vi at inddrage SF-36, der er valideret og gennemtestet adskillige gange både i danske og internationale undersøgelser, og som benyttes i mange studier (10, 16). Svagheden ved SF-36 er, at skemaet ikke er sygdomsspecifikt for patienter med lænderygbesvær med evt. iskias i modsætning til RMQ og RS. Wiesinger et al (10) udførte en lignende undersøgelse af patienter med lændesmerter. Efter oversættelse af RMQ til tysk undersøgte han skemaets begrebsvaliditet ved at sammenligne med SF-36. Undersøgelsens resultater viste, at korrelationen mellem skalaen fysisk funktion fra SF-36 og RMQ er statistisk signifikant (p = 0,001), hvor r = -0,71. Dette er i overensstemmelse med resultaterne i dette studie.

Limit of agreement ligger mellem -20 procentpoint og 40 procentpoint, hvilket betyder, at sammenlignes RS med RMQ ved samme patient vil den forventede tilsvarende værdi på RS være mellem 5 point og -10 point under. I begge differensplot ses en meget svag stigning fra de lave værdier til de højere værdier, dette er et udtryk for, at der er observeret en større variation i RMQ end i de andre skalaer, hvilket er positivt og er en bekræftelse af de internationale fund, at RMQ er mere følsom end andre skemaer (7, 11-13).

I en tid, hvor forskning sker i et større omfang på tværs af landegrænser, og hvor vi sammenligner os med behandlingscentre internationalt, er det aktuelt at indføre internationale standar diserede instrumenter til vurdering af ændringer i funktionsniveau hos patienter med diskusprolaps. RMQ er det skema, som nævnes hyppigst i anerkendt international litteratur, og flere forskere (2, 7, 11-13) betegner skemaet som det mest velegnede instrument til brug i klinisk praksis og forskning. Vi vil understrege, at i klinikerens og forskerens evaluering af patientens forbedring eller forværring er det særdeles vigtigt at medtage patientens oplevelse af sit eget funktionsniveau. Der er ikke megen pointe i, at en klinisk undersøgelse viser, at der er en mindsket finger-gulv-afstand, og at Schobers test er forbedret, og at behandleren derved konkluderer, at patientens symptomer er forbedret, hvis patienten stadigvæk ikke kan tage sko og strømper på, uden at det fremprovokerer smerter. Ud fra empirisk erfaring er en klinisk undersøgelse dog stadigvæk en essentiel nødvendighed til diagnosticering og planlægning af behandling. Men netop hos patienter med lændesmerter er der stillet spørgsmålstegn ved værdien af en klinisk undersøgelse, idet Albeck et al (17) i en undersøgelse har vist, at anamnestiske oplysninger om udstrålende smerter er vigtigere i diagnostisk sammenhæng end de kliniske undersøgelsesfund.

Der står stadigvæk tilbage at bekræfte, at den danske oversættelse svarer til de internationale fund med hensyn til sensitivitet. En fuld validering af RMQ og dette arbejde er undervejs. Med baggrund i vores undersøgelse og andre lignende internationale undersøgelser, mener vi, at RMQ vil være et godt instrument til i større grad at kunne dokumentere og synliggøre effekten af den pågældende behandling til patienter med lænderygsmerter med eventuelle udstrålende smerter.


Hanne Albert, Rygambulatoriet, Sygehus Fyn, DK-5750 Ringe.
E-mail: haal@shf.fyns-amt.dk

Antaget den 20. februar 2003.

Sygehus Fyn Ringe, Rygambulatoriet.

Korrespondenterne med certifikat i LSP (engelsk, tysk, spansk) Lykke Sørensen, Hella Leth Nielsen og cand.mag. Lise Lotte Larsen takkes for oversættelse og sproglig bearbejdning. De ortopædkirurgiske afdelinger på Vejle, Silkeborg og Esbjerg Varde Sygehuse takkes for godt samarbejde. Ph.d. Lars Korsholm, afdelingen for statistik og demografi, Syddansk Universitet, takkes for statistisk rådgivning.





Referencer

  1. Statens Institut for Medicinsk Teknologivurdering. Ondt i Ryggen: Forekomst, behandling og forebyggelse i et MTV-perspektiv. Serie B. København: Medicinsk Teknologivurdering 1999:1.
  2. Waddell G. The Back Pain Revolution. London: Churchill Livingstone, 1998.
  3. Beurskens AJHM, de Vet HCW, Köke AJA. Responsiveness of functional status in low back pain: a comparison of different instruments. Pain 1996;65:71-6.
  4. Underwood MR, Barnett AG, Vickers MR. Evaluation of two time-specific back pain outcome measures. Spine 1999;24:1104-12.
  5. Patrick DL, Deyo RA, Atlas SJ et al. Assessing health-related quality of life in patients with sciatica. Spine 1995;20:1899-909.
  6. Roland M, Morris R. A study of the natural history of back pain. Part I: development of a reliable and sensitive measure of disability in low-back pain. Spine 1983;8:141-5.
  7. Stratford PW, Binkley JM. Applying the results of self-report measures to individual patients: an example using the Roland-Morris Questionnaire. J Orthop Sports Phys Ther 1999;29:232-9.
  8. Leclaire R, Blier F, Fortin L et al. A cross-sectional study comparing the Oswestry and Roland-Morris functional disability scales in two populations of patients with low back pain of different levels of severity. Spine 1997;22:68-71.
  9. Manniche C, Asmussen K, Lauritsen B et al. Low back pain rating scale; validation of a tool for assessment of low back pain. Pain 1994; 57:317-26.
  10. Wiesinger GF, Nuhr M, Quittan M et al. Cross-cultural adaptation of the Roland-Morris Questionnaire for German-speaking patients with low back pain. Spine 1999;24:1099-103.
  11. Stratford PW, Finch E, Solomon P et al. Using the Roland-Morris Questionnaire to make decisions about individual patients. Physiother Can 1996;48:107-10.
  12. Stratford PW, Binkley JM, Riddle DL et al. Sensivity to change of the Roland-Morris Back Pain Questionnaire: Part I. Phys Ther 1998;78:1186-96.
  13. Riddle DL, Stratford PW, Binkley JM. Sensivity to change of the Roland-Morris Back Pain Questionnaire: Part 2. Phys Ther 1998;78:1197-207.
  14. Engelmann MDM. Sammenhæng eller overensstemmelse mellem kliniske målemetoder. Ugskr Laeger 2000;162:4400-1.
  15. Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1986;1:307-10.
  16. Bjørner JB, Damsgaard MT, Watt T et al. Dansk manual til SF-36. København: Lif, 1997.
  17. Albeck MJ. A critical assessment of clinical diagnosis of disc herniation in patients with monoradicular sciatica. Acta Neurochir (Wien) 1996;138: 40-4.