För det första påstås att »risken att feltolka analyser som baseras på sådana [icke-parametriska] test« är liten. Det redovisas dock inget empiriskt underlag för påståendet. Vi anser det vara viktigt att underliggande antaganden är uppfyllda. Annars kan ju ett testresultat bero mera på gjorda antaganden än på observation av verkligheten. Att EQ-5D-indexdata är oförenliga med konventionella testantaganden är också otvivelaktigt och ifrågasätts heller inte av Nemes et al.
För det andra hävdar Nemes et al att det »är fel att påstå att ett förbättrat normalfördelningsmedelvärde representerar en förbättring för hela populationen«. Förbättringen är däremot »representativ för populationen men inte för den enstaka individen«. Påståendet avspeglar möjligen vad Esaias Tegnér talade om i sin »Epilog vid magisterpromotionen i Lund 1820«.
Vad du ej klart kan säga, vet du ej;
med tanken ordet föds på mannens läppar:
det dunkelt sagda är det dunkelt tänkta.
Vad Nemes et al inte nämner är nämligen att de två parametrarna medelvärde och varians, som entydigt definierar en normalfördelad population, inte räcker för att beskriva en bi- eller multimodalt fördelad population. Som konsekvens av detta kan till synes obetydliga förändringar i ett EQ-5D-indexmedelvärde dölja väsentliga strukturella individuella förändringar (vi visade exempel på detta i LT 36/2011, sidorna 1707-8). Att en medelvärdesförändring i en normalfördelad population baseras på slumpmässigt varierande individuella förändringar är en helt annan sak.
För det tredje hävdas beträffande vårt exempel 1 att statistisk insignifikans är ett tecken på likhet: »Analys med testet ANOVA bekräftar … att grupperna i exemplet är oskiljbara (P = 0,8)«. Detta är ett tankefel i två hänseenden: Dels vet vi med säkerhet att grupperna är olika. Vi har nämligen, i detta hypotetiska exempel med fiktiva data, själva bestämt parametervärdena. Dels ger P-värden information bara om risken för falskt positiva fynd, inte för falskt negativa. Altman och Bland beskriver därför statistisk insignifikans i sin metodserie i BMJ (1995;311:485) med orden: »absence of evidence, not evidence of absence«.
Man skulle visserligen kunna hävda att skillnaderna mellan grupperna ur klinisk synvinkel är små och betydelselösa, men det är i så fall en klinisk värdering man gör, ingenting som en ANOVA kan ge någon vägledning om.
Läs mer:
Utvärdering med EQ-5D-index kan påvisa ojämlikhet i vården