Sveriges Kommuner och Landsting (SKL) och Socialstyrelsen publicerar årligen rapporten »Öppna jämförelser av hälso- och sjukvårdens kvalitet och effektivitet« [1] för att ge »en heltäckande bild av verksamheternas kvalitet och effektivitet« [2]. Jämförelserna har hittills bestått i rangordning av landstingsverksamhet, men strategin är att rapportera även på sjukhus- och kliniknivå [3].
Rangordningsjämförelser förekommer också i andra länder. I Storbritannien har det t ex under många år publicerats »league tables« för skolor och sjukhus. Detta har lett till att rangordningsjämförelser identifierats som ett allvarligt metodologiskt problem [4]. Ledande statistiker har rekommenderat att redovisningarna bör upphöra [5].
Vi vill varna för förhastade slutsatser av rangordning och uppmuntra till stor försiktighet med tolkning av resultaten.

Vad som är det sanna genomsnittliga resultatet av en viss behandling vid ett visst sjukhus kan bara bestämmas för definierade grupper av redan behandlade patienter. Sådana resultat avspeglar emellertid endast historiska förhållanden, påverkade av tillfälligheter, och kan inte utan vidare användas för jämförelser av framtida behandlingsresultat.
Det observerbara genomsnittliga resultatet av en behandling vid ett sjukhus är inte konstant. Olika urval av patienter som får samma behandling har olika genomsnittsresultat. Denna sjukhusspecifika variabilitet måste beaktas för att jämförelser mellan sjukhus ska vara meningsfulla.
Anta exempelvis att ett gammalt välrenommerat sjukhus under 2007 redovisat att 14800 patienter behandlats för en viss allvarlig sjukdom och att 3700 överlevt (25 procents överlevnad). Ett nystartat sjukhus för alternativ medicin redovisar samtidigt att en patient framgångsrikt behandlats för samma sjukdom och överlevt hela året (100 procent överlevnad).

Bortser man från urvalsosäkerheten kan man konstatera att det nya sjukhuset var betydligt mera framgångsrikt än det gamla eftersom överlevnaden var 100 procent jämfört med 25 procent. Då måste man emellertid också acceptera att resultatet vid det nya sjukhuset enbart gäller den redan behandlade patienten och saknar relevans för andra, framtida, patienter.
Betraktar man i stället sjukhusens behandlingar under 2007 som slumpurval och använder observerade genomsnittsvärden som skattningar av sjukhusens totala genomsnittsresultat, blir jämförelserna intressanta ur ett allmänt patientperspektiv och kan tolkas med utgångspunkt från kvalitet och effektivitet.
Urvalsosäkerheten måste då naturligtvis beräknas, och en felmarginal anges för varje skattning. Detta görs lämpligen i form av ett 95-procentigt konfidensintervall, konstruerat så att det med 95-procentig säkerhet omfattar det skattade värdet. Felmarginalerna i exemplets överlevnadstal, 25 procent och 100 procent, blir ungefär 24–26 procent respektive 0–100 procent.
Någon meningsfull effektivitets- och kvalitetsorienterad jämförelse med det nya sjukhuset kan alltså inte göras.

Ju större osäkerhet och homogenitet som kännetecknar observerade genomsnittliga behandlingsresultat, desto mindre meningsfullt är det att rangordna dem, se Figur 1.
Urvalsosäkerheten för två sjukhus A och B symboliseras med normalfördelningar. Varje fördelning beskriver den uppsättning genomsnittliga behandlingsresultat som kan observeras i olika slumpurval från respektive sjukhus.
I extremfallet att sjukhusen har identiska totala genomsnittliga behandlingsresultat (Exempel 1) kommer all rangordning att bli missvisande och enbart avspegla urvalsskillnader.
I det andra extremfallet är rangordningen tillförlitlig (Exempel 3). Den kombinerade urvalsosäkerheten är då mindre än skillnaderna i de totala genomsnittliga behandlingsresultaten.
I »Öppna jämförelser« redovisad variabilitet i observerade behandlingsresultat och deras konfidensintervall tyder inte på att genomförd rangordning är tillförlitlig.

Ett annat problem för rangordning är att registerdata inte alltid är korrekta. Konsekvenserna av detta är förmodligen i många fall försumbara jämfört med urvalsosäkerheten, men låt oss för resonemangets skull göra det tvivelaktiga antagandet att observerade genomsnittliga behandlingsresultats rangordning är meningsfull i sig.
En nyligen genomförd simuleringsstudie [6], baserad på av Höftprotesregistret publicerade data om reoperation inom 2 år vid 77 sjukhus [7], visar att redan vid 2–3 procent oregistrerade operationer får hälften av sjukhusen fel rang, och felet kan vara avsevärt – för vissa sjukhus uppåt 20 placeringar.
Svenska kvalitetsregister har i bästa fall en kompletthet av ungefär 96–97 procent [8, 9].
Det första nationella kvalitetsregistret, Svenska Knäprotesregistret, har sedan starten 1975 redovisat [10] klart minskad risk för omoperation. Reoperationsrisken har i Sverige under de senaste två decennierna halverats och är nu lägst i världen. Skillnader i klinikresultat har också minskat avsevärt. Detta gäller även höftproteskirurgin.
Förbättringen har åstadkommits i en löpande dialog med inrapporterande enheter, där brister i patienturval, protes och kirurgisk teknik redovisats, men också med årlig återrapportering av klinikspecifika resultat, utan att rangordna sjukhus.
En direkt konsekvens av minskade sjukhusskillnader är att rangordning fungerar allt sämre som förbättrings- instrument. Nya och bättre metoder att skatta sjukhusspecifika behandlingsresultat finns och har tagits i anspråk [11] men förändrar inget i sak. Som instrument att förbättra sjukvården riskerar rangordning i stigande grad att leda till »förbättringsförsämring« genom att dåliga förebilder framställs som goda och vice versa.

Urvalsosäkerheten i »Öppna jämförelsers« rangordningar bör naturligtvis redovisas öppet, tex med konfidensintervall för rangtal [12].
Ännu bättre är att helt överge rangordning och basera jämförelser på både observerat resultat och på resultatets säkerhet, exempelvis med kategorierna: 1) säkerställt gott resultat, 2) säkerställt dåligt resultat och 3) osäkert resultat. De tre kategorierna kan symboliseras med stoppljus eller varför inte som »smileys«.
Även jämförelser som tar hänsyn till urvalsosäkerhet blir emellertid med systematiska skillnader i patienters kön, ålder, sjuklighetsgrad, komorbiditet, etc missvisande. Rättvisa jämförelser kräver korrektion för obalans i prognostiska faktorer bland patienterna, ett omfattande arbete.

Potentiella bindningar eller jävsförhållanden: Inga uppgivna.


Figur 1. Behandlingsresultat och urvalsosäkerhet.