Traditionellt har man använt olika kliniska mätvariabler vid utvärdering av resultaten efter kirurgi. Inom ortopedin har utfallet utvärderats till exempel genom bilddiagnostik, bedömning av smärta, muskelstyrka, ledrörlighet och grad av felställning. Klinisk utvärdering har ofta utförts av opererande kirurg. Detta innebär risk för en icke objektiv bedömning, då undersökarens bedömning kan styras mot det resultat man hoppas uppnå. Många kliniska test har även låg intrabedömar-reliabilitet, det vill säga dålig överensstämmelse vid jämförelse av samma undersökare vid två närliggande undersökningstillfällen, och låg interbedömar-reliabilitet, det vill säga dålig överensstämmelse vid jämförelse mellan två olika undersökare. Ofta korrelerar också patienternas hälsorelaterade livskvalitet och upplevda besvär dåligt med objektiva fynd. Individer har olika förutsättningar, krav, behov och förväntningar och därför kan samma kliniska fynd (t ex muskelstyrka) upplevas olika, och på motsvarande sätt kan samma grad av felställning eller röntgenologiska fynd ge upphov till helt olik subjektiv symtombild. 

Det har blivit allt vanligare att använda sig av patientrapporterade utvärderingsformulär där patienten själv svarar på frågor som berör upplevd smärta, funktion och hälsorelaterad livskvalitet. Patientrapporterade utfallsmått finns både som allmänna (generiska) eller specifika för en sjukdom, ett tillstånd eller en anatomisk region. 

Frågeformulär vinner terräng

Utvärderingsinstrument i form av frågeformulär där poängen för varje fråga räknas samman till en delskalesumma eller totalsumma har nu vunnit terräng. Initialt utformades dessa oftast med två delar; en undersökarberoende och en patient­rapporterad. Den undersökarberoende delen uppfattades initialt som en objektiv värdering och den patientrapporterade som en subjektiv upplevelse av besvären. Dessa utvärderingsinstrument blev trots avsaknad av utvärdering (validering) mycket populära. Exempel på ett sådant utvärderingsinstrument är Constant score för utvärdering av axelbesvär. När det gäller fot- och fotledsåkommor är American Orthopaedic Foot and Ankle Society score (AOFAS) [1], som innehåller en undersökarberoende och en patientrapporterad del, det mest använda utvärderingsinstrumentet. 

De undersökarberoende utvärderingsinstrumenten har kritiserats alltmer då de inte kan anses vara objektiva utan påverkas av undersökarens förväntningar. Instrument som kräver undersökning är också av logistiska skäl mindre lämpliga vid insamling av data till nationella register. Därför har olika patientrapporterade utfallsmått vunnit gehör, och som ett resultat av detta har patientrapporterade utvärderingsinstrument utvecklats och validerats för olika medicinska specialiteter/subspecialiteter. Som exempel kan nämnas Oxford hip score för utvärdering av höftåkommor och Knee injury and osteoarthritis outcome score för utvärdering av knäbesvär. Inom fotkirurgin finns det inte något validerat patientrapporterat utvärderingsinstrument som är internationellt accepterat. 

Generiska och regionspecifika utvärderingsinstrument

Generiska utvärderingsinstrument mäter patientrapporterat generellt hälsotillstånd eller hälsorelaterad livskvalitet, där EQ-5D [2] och SF-36 [3] är de vanligast använda. Med regionspecifika utvärderingsinstrument menar vi instrument som utvärderar en specificerad anatomisk region som knät eller ryggen. 

De regionspecifika instrumenten är känsligare än de generiska på att fånga förändringar efter intervention som kirurgi, och därför lämpliga att använda när man ska utvärdera behandlingsresultat. Det finns olika regionspecifika patient­rapporterade utfallsmått som riktar sig mot fot och fotled, men inget som är fullt validerat och allmänt accepterat. Foot and ankle outcome score (FAOS) [4] är fot- och fotledsspecifikt, dock validerat enbart för ett begränsat antal diagnoser. Dessutom innehåller FAOS för många frågor för att enkelt kunna användas vid insamling av registerdata. Då AOFAS ford­rar en klinisk undersökning är inte heller detta instrument lämpligt att användas i nationella register. Med SEFAS (Self-reported foot and ankle score) har vi identifierat ett för fot och fotled regionspecifikt patientrapporterat utvärderingsinstrument som på ett bra sätt evaluerar smärta och funktion.

Validering av utvärderingsinstrument

Utvärderingsinstrument bör valideras före användning. In­nan man väljer ett utvärderingsinstrument bör man ta reda på om en validering är utförd, det vill säga om instrumentets olika psykometriska egenskaper är testade med bra utfall. Man bör dessutom kontrollera huruvida instrumentet kräver licens eller är fritt tillgängligt och om instrumentet är enkelt att använda för såväl patienter som professionen. Man väljer sedan instrument utifrån de syften man har med utvärderingarna och under vilka omständigheter man tänkt sig använda instrumentet. I registersammanhang med stora patientgrupper bör självfallet frågorna inte vara för många då detta kan påverka svarsfrekvensen.  

Ett utvärderingsinstruments psykometriska egenskaper delar man upp i begreppen validitet, reliabilitet och responsivitet [5, 6], Figur 1. 

Validitet innebär att ett instrument mäter det man avser att mäta. Det finns flera typer av validitet, såsom innehållsvaliditet, kriterievaliditet samt begreppsvaliditet. Med innehållsvaliditet menas i vilken utsträckning ett instrument täcker in alla aspekter av det som ska mätas. Både experter och berörda patientgrupper bör värdera om instrumentets frågor är relevanta och lätta att förstå. Kriterievaliditet värderar hur ett utvärderingsinstrument förhåller sig till det instrument som betraktas som etablerad standard. När det inte finns något dylikt instrument används i stället begreppsvaliditet, som värderar hur väl ett instrument korrelerar till and­ra befintliga instrument inom området. Begreppsvaliditet kräver en hypotes där testaren uttalar sig om man förväntar hög eller låg korrelation mellan olika instrument. Om hypoteserna bekräftas, det vill säga att man får en stark korrelation (konvergerande begreppsvaliditet) mellan frågor som eftersöker samma sak respektive en svag korrelation (divergerande begreppsvaliditet) mellan frågor som eftersöker olika egenskaper, föreligger en god begreppsvaliditet. Begreppsvaliditet testas med Spearmans korrelationskoefficient, där en koefficient på över 0,60 anses som hög och under 0,30 som låg [5]. Golv- och takeffekter innefattas också i validitetsbegreppet. Golv- och takeffekter anses föreligga om >15 procent av patienterna får utvärderingsinstrumentets högsta eller lägsta värde [5]. Hos patienter med det högsta värdet kan förbättringar inte registreras och hos dem med lägsta värdet kan försämringar inte registreras. I ett idealt utvärderingsinstrument finns inga golv- och takeffekter.

Begreppet reliabilitet värderar ett instruments tillförlitlighet/reproducerbarhet. Denna sker med ett test–återtest där man ser om instrumentet ger samma resultat om det fylls i två gånger av samma patient med kort mellanrum och patientens symtombild inte har förändras. Resultaten jämförs statistiskt med intraklasskorrelationskoefficienten där ett värde över 0,70 anses bra [7]. En annan form av reliabilitet är intern konsistens, som utvärderar hur väl de enskilda frågorna i ett instrument fångar de dimensioner man vill utvärdera. Intern konsistens beräknas statistiskt med Cronbachs alfa. Tolkningen av resultatet är svår då man varken vill ha ett för högt värde, då frågorna i så fall värderar samma sak utan att ge ny information, eller ett för lågt värde, då frågorna i detta fall fångar helt olika saker och kan vara helt orelaterade till den åkomma man vill värdera. Ett Cronbachs alfa-värde över 0,95 anses för högt och ett under 0,70 för lågt [6]. 

Responsivitet definieras som förmågan hos ett utvärderingsinstrument att fånga en klinisk relevant förändring efter någon form av intervention. Effektstorlek är ett vanligt förekommande sätt att värdera responsivitet, där effektstorlek över 0,80 anses som god responsivitet [8].

Svenskt fotkirurgiskt register

Årligen utförs i Sverige mer än 20 000 planerade kirurgiska ingrepp i fot och fotled, och med denna mängd bör en allmän utvärdering av patientnyttan initieras, både på offentliga och privata vårdenheter. Vi har därför utvecklat och validerat ett regionsspecifikt utvärderingsinstrument för fot- och fotledsbesvär. New Zealand ankle questionnaire (NZAQ) utvecklades från det validerade instrumentet Oxford 12 för höft men är inte validerat [9]. Vi översatte och modifierade därför NZAQ till svenska förhållanden och visade sedan att den svenska versionen SEFAS oberoende av grunddiagnos har bra psykometriska egenskaper hos patienter med fotleds-, bakfots-, mellanfots- och framfotsbesvär [10-12]. Dessutom var de psykometriska egenskaperna lika bra eller bättre för ­SEFAS än för EQ-5D, SF-36, FAOS och AOFAS [13]. SEFAS tar också, precis om EQ-5D, kortare tid att fylla i än övriga instrument (Figur 2). Då SEFAS uppfyller kvalitetsregistrens syften att bedriva verksamhetsanalys, stimulera till kliniskt förbättringsarbete och bedriva klinisk forskning, anser vi att SEFAS är ett användbart instrument i ett nationellt kirurgiskt fot- och fotledsregister. I en pågående studie testas nu SEFAS på patienter opererade för förvärvad plattfothet [11]. SEFAS fångar då väl att patienterna får minskad smärta och bättre funktion med kirurgi, fynd som stärker vår övertygelse att SEFAS är ett utmärkt instrument i nationell registerforskning.

Sedan 2009 används SEFAS i det Svenska fotledsregistret innefattande fotledsproteser och fotledsartrodeser. Under 2015 kommer vi publicera patientrapporterade utfallsmåttsdata från detta register. För närvarande används också SEFAS i den pilotstudie som föregår det planerade svenska fotkir­urgiska registret, Riksfot, som ska innefatta all typ av fotkirurgi. Riksfot, med planerad nationell start i april 2015, kommer att bli det första nationella register som innefattar all kirurgisk behandling i fot och fotled, ett register som då kan använda ett validerat regionspecifikt patientrapporterat utvärderingsinstrument från starten. 

Potentiella bindningar eller jävsförhållanden: Inga uppgivna.