Om man har en skattningsskala för hur kallt man tror att människor tycker att det är vid olika temperaturer och jämför skattningarna med motsvarande avlästa temperaturer, kan man med cirkelresonemang och statistisk okunskap få fram fina »korrelationer« som man tycker »validerar« skattningsskalan.
Sedan tar man medelvärdena (!) av folks skattningar på olika orter i Sverige för att få en kvantitativ jämförelse över var det är bäst att bo.
Denna typ av cirkelresonemang och felaktiga användning av en skala i ett annat sammanhang än den är avsedd för gör NYSAM (Nyckeltal i samverkan) med GAF-skalan inom psykiatrin i flera landsting i Sverige i den falska tron att man därmed kan jämföra vårdkvaliteten mellan olika kliniker.
GAF-skalan är framtagen för att man ska kunna skatta och följa en individuell patients sjukdomsutveckling i jämförelse med henne själv. Nu har en lång rad landsting i Sverige beslutat att alla patienter ska »gaffas« vid intagningen och vid utskrivningen. Sedan ska medelvärdet av alla patienters GAF-värden beräknas och användas som så kallade nyckeltal för jämförelser mellan olika klinikers arbete inom »NYSAM – Nyckeltalssamverkan«, tydligen i tron att GAF-medelvärdena är ett mått på klinikernas kvalitet och effektivitet!
Eftersom det omedelbart inger betänkligheter att en skala, som är framtagen för ett visst ändamål, plötsligt börjar användas för andra ändamål, tittade vi, läkargruppen vid vuxenpsykiatriska kliniken i Växjö, närmare på GAF-skalan och NYSAM-rapporterna [1, 2].
Till vår förfäran fann vi sådana mängder med märkligheter att vi nyligen i en lång skrivelse uppmärksammat Socialstyrelsen på några av dessa. Vi har inte erbjudits några begripliga förklaringar eller välgrundade argument för denna eller någon annan användning av GAF-skalan och kan inte se att den allmänna »gaffningen« tillför mer än extra arbete i onödan med risk för skadliga efterverkningar på både vården och vårdekonomin.


Gnistan som tände vårt motstånd
Klinikledningen har inte lyssnat på vetenskapliga argument, utan GAF-skalan ska här i Landstinget Kronoberg användas av all journalförande personal på alla patienter och registreras i vårt patientdatasystem Cambio Cosmic. Vid vårdkonferenser ska man enas om vilket GAF-värde som ska registreras i varje enskilt fall. Utan GAF-poäng kommer man inte ens vidare i programmet. Ett dekret om detta gick nyligen ut, men däri angavs inget syfte.
Så länge som syftet inte var skriftligt uttalat och accepterat såg vi det som särskilt oetiskt att lägga på all personal en extra uppgift som tar tid och inte uppenbart gagnar någon patient, åtminstone inte såsom det upplevs. Vi har endast fått summarisk utbildning i hur GAF-skalan ska användas, och osäkerhetskänslan är utbredd.
Sedan vi tagit del av NYSAM-rapporterna var det dock lätt att genomskåda att det tänkta syftet är att den sedan framtagna statistiken ska användas för kvalitetsjämförelser mellan kliniker. Statistikbehandlingen i de för oss tillgängliga NYSAM-rapporterna visade sig dessutom vara under all kritik.
Det var gnistan som tände vårt motstånd. Att jämföra kliniker är en svår uppgift som kräver en helt annan insats än slarvigt och felaktigt använda data. Detta har påpekats vid flera tillfällen i till exempel Läkartidningen [3, 4].


Är inte okontroversiell
GAF-skalan är en skala för så kallad global funktionsskattning (global assessment of function) inom psykiatrin. Den ingår i DSM-III och DSM-IV och har utvecklats och använts under många år över hela världen. Den har 101 skalsteg med 0 som beteckning för »otillräcklig information« och sedan 1 som sämst och 100 som bäst. Såväl psykiatriska symtom som sociala funktioner skattas.
Skalan är inte okontroversiell ens i det korrekta användningsområdet, det vill säga när patienten jämförs med sig själv vid olika tillfällen [5, 6]. I bästa fall är det en rangskala, men det finns goda argument för att betrakta den som en nominalskala. Skalstegen 1–100 är undergrupperade i tio »kluster« med tio steg vardera. Exempelvis ska klustret 91–100 poäng användas för »inga symtom« och 81–90 för »frånvaro av symtom«. – Hur graderar man friskhet utmed en sammanlagt tjugogradig skala?


Tre fundamentala problem
Tre fundamentala problem som ytterligare adderats i NYSAM-arbetet sticker särskilt ut:
1. Genom att skattningarna registreras som siffror har NYSAM-forskarna förlett sig själva att räkna aritmetiska medelvärden per verksamhetsenhet, till och med med två decimaler! Med den typen av logik kan man också räkna medelvärden på fotbollströjors nummer. Men logiken bakom formeln för att räkna aritmetiskt medelvärde kräver normalfördelade data på lägst en intervallskala, såsom till exempel en temperaturskala, med definitionsmässigt lika stora intervall mellan skalstegen i skalans alla delar [7, 8].
2. NYSAM »validerar« skattningsskalan och skattningsprocessen genom att räkna »korrelationer« mellan å ena sidan den skattade GAF-poängen för social funktion, å andra sidan patientens aktuella sociala funktion. (Samt motsvarande för psykiatriska symtom och symtom-GAF-poäng.)
Trots detta cirkelresonemang och användande av parametrisk statistik på ickeparametriska data får man som högst inte bättre »korrelationer« än r=0,406 (med tre decimaler!).
I klartext vid korrekt använd statistik betyder detta att 16 procent (0,4 i kvadrat = 0,16) av variationen i den beroende variabeln (vilken av dem är det i detta fall?) kan förklaras av variationer i den oberoende variabeln (vilken är det??) – förutsatt att det finns ett linjärt samband.
Vi tycker inte att en 16-procentig förklaringsnivå är imponerande alls när det handlar om ett cirkelresonemang. Knappast annars heller. Men i en NYSAM-rapport uppfattas detta och andra, ännu lägre, r-värden som »relativt höga och signifikanta korrelationer« ([1], Tabell 1, sidan 9). Någon golden standard att jämföra med presenteras över huvud taget inte.
3. NYSAM använder sedan sina siffror som resultatmått för att jämföra olika psykiatriska enheter i olika landsting med varandra! Kanske blir ett fotbollslag bättre om man använder spelare med höga nummer på tröjan?
Varje läsare som klarat grundkursen i statistik och forskningsmetodik blir sålunda förvånad på sida efter sida i NYSAM-rapporterna. Inte minst förvånad blir man av författarnas slutsats att GAF-skalans validitet bekräftas. Vi kan emellertid inte se annat än att validitetsberäkningarna underkänner både GAF-skalan och dess förespråkare.
Vår slutsats efter genomgång av för oss tillgängliga NYSAM-rapporter från GAF-projektet är att det ter sig oförsvarbart, oetiskt och oekonomiskt att införa ett skattningssystem som GAF-skalan utan att vare sig syftet eller användningssättet anges, och utan att tidigare användning eller forskning visat att måttet är säkert relevant för någonting över huvud taget, allra minst för jämförelser mellan kliniker, och där dess hittills publicerade analyser i Sverige förefaller vara alltför ovetenskapligt utförda.
NYSAM-arbetet har tyvärr redan pågått i några år i ett antal landsting i Sverige till en kostnad som vi inte vågar spekulera om.
Man kan fråga sig om några slutsatser dragits som lett till konkreta, förbättrande åtgärder inom vården, och i så fall vilka?
Och på vilka grunder ska vi våga hoppas att de slutsatserna är korrekt dragna och åtgärderna de rätta? Hur kan detta få pågå i en tid då evidensbaserad medicin är högsta mode?
NYSAM-arbetet och GAF-skattningarna måste skyndsammast granskas av Socialstyrelsen.

(Hela skrivelsen till Socialstyrelsen finns i pdf-format på Psykiaterlistans webbplats, http://health.groups.yahoo. com/group/psykiaterlistan/files/.)