Mallett och medarbetare har i BMJ publicerat en genomgång av 89 systematiska översikter av studier om diagnostiska test inom cancerområdet [1].
Av dessa översikter granskades 25 (slumpvis utvalda) i detalj. Författarna konkluderade att reliabiliteten och relevansen av systematiska översikter inom detta område hotas av brister vad gäller både presentationen och de metoder som använts för översikterna.
Särskilt tung kritik riktade Mallett och medarbetare mot de översikter som använts som underlag för kliniska riktlinjer.


Påtagliga brister
En fjärdedel av översikterna saknade specifika inklusionskriterier för vilka studier som tagits med, och i 20 procent av översikterna saknades angivande av söktermer i databaserna. Hälften av översikterna rapporterade inte sammansättningen av patientgrupperna vad gäller cancerstadium, och bara 17 procent beskrev den kliniska miljö i vilken de inkluderade studierna var gjorda.
I så många som 20 av de 25 detaljgranskade översikterna rapporterades inte hur patienterna i de enskilda studierna hade inkluderats. Bara cirka en tredjedel av de noggrant genomgångna översikterna beskrev vad som var diagnostiska kriterier för ett positivt utfall i det etablerade standardtest som använts.
Endast lite mer än hälften av de 25 detaljgranskade översikterna gav så detaljerad information att Mallett och medarbetare kunde ställa upp egna korstabeller för att göra beräkningar av sensitivitet, specificitet, likelihood-kvot och andra parametrar. I bara ungefär hälften av översikterna gavs mer detaljerad information om hur data hade extraherats ur respektive originalartikel.


Bristande förståelse i metodfrågor
Standarden på översikter inom det diagnostiska cancerområdet är således genomgående låg. Det innebär att vi som läsare måste vara extra vaksamma på om grundläggande kvalitetskriterier har uppfyllts i aktuella och kommande översikter, så att vi grundar slutsatser endast på publikationer som är rimligt tillförlitliga.
Genomgången pekar också på att det genomgående tycks finnas en grundläggande brist hos både författare och granskare vad gäller förståelsen av centrala metodfrågor i diagnostiska studier.
Ett underliggande och allvarligt problem är att också originalstudierna av diagnostiska test genomgående har en låg kvalitet [2-5]. Flera författare har konstaterat att standarden på forskning om diagnostiska test fortfarande genomgående – och inte bara inom cancerområdet – ligger långt efter vad som krävs för tex randomiserade kliniska studier av terapeutiska interventioner.


Särskilt oroande vad gäller riktlinjer
Det är särskilt oroande att översikter som genomförts för utarbetande av tre kliniska riktlinjer samt två hälsoekonomiska analyser hade särskilt många metodologiska problem.
Det finns ingen uppenbar förklaring till detta förhållande. Möjligen har det inte funnits resurser inom de grupperingar som gjort riktlinjerna för att göra det omfattande arbete som krävs för en översikt inom det diagnostiska området.
Oroande spekulationer är att utvärdering av diagnostik prioriterats ned i riktlinjearbetet eller att det allmänt finns för låg kompetens för en kritisk utvärdering.
Mallett och medarbetare drar slutsatsen att översikter bäst görs fristående från kliniskt riktlinjearbete. Det är inte säkert att detta är lösningen, men under alla omständigheter tycks det uppenbart att energi måste läggas på att förbättra kvaliteten för beslutsunderlag inom det diagnostiska området.


Säkerhet och kostnadseffektivitet
Genomgången i BMJ ger en blixtbelysning av ett stort problemområde. Om våra krav på standard på klinisk forskning om diagnostiska test är låg, har det allvarliga implikationer för i första hand patientsäkerheten.
I klinisk vardag måste vi hantera test på ett optimalt säkert sätt såväl för den enskilda individen som för grupper av individer.
Vi måste också i en hårdnande kravmiljö på ansvarsfull resursanvändning [6] vara säkra på att vi använder diagnostiska test på ett kostnadseffektivt sätt. Detta torde inte vara möjligt utan en valid utvärdering av vilken plats olika undersökningar har i den diagnostiska arsenalen.
En ofta nämnd farhåga är att vi bara lägger till nya diagnostiska test utan att ta bort gamla och således på ett oklart sätt fördyrar diagnostiken utan en rationell diskussion om eventuella vinster.
Denna farhåga är dock mycket sällan kritiskt studerad. Sådana studier behövs för en bra, säker och kostnadseffektiv diagnostisk arsenal.


Svårt bedöma metaanalysers kvalitet
Malletts och medförfattares artikel illustrerar också tydligt att det är en krävande forskningsprocess i sig att göra en kritisk och valid översikt. Det räcker inte med att konstatera att en systematisk översikt ligger till grund för en rekommendation av ett diagnostiskt test. Vi måste också fråga oss vilken kvalitet den systematiska översikten har och om det finns väsentliga metodproblem.
Genomgången i BMJ visar också att en metaanalys inte blir mera rätt bara för att den har ett stort empiriskt underlag, beskrivs med många ord eller har en bred ansats. Studiekvaliteten var nämligen inte relaterad till metaanalysens sidantal, när den publicerades, typ av diagnostisk teknologi, antal sjukdomar eller indextest som studerades.
Det är således inte trivialt att vare sig göra eller utvärdera en översikt; särskilt inte inom det diagnostiska området, eftersom vi hittills har få bra modellartiklar.
Det har emellertid kommit en bra metodbok inom det diagnostiska området som varmt kan rekommenderas [7].
*
Potentiella bindningar eller jävsförhållanden: Inga uppgivna.

Fakta 1.

Några grundläggande krav på rapportering av diagnostiska studier
• Referenstestet och dess kriterier för normalt/ onormalt skall definieras noga.
• Referenstestet och det nya testet skall ha utvärderats blindat i förhållande till varandra.
• Om det är ett referenstest som innebär ett betydande moment av subjektiv bedömning, skall det finnas någon sorts reliabilitetstest.
• Referenstestet (eller ett surrogat för detta) skall utföras på alla i studien ingående individer.
• Sammansättningen av patientgruppen (dvs blandningen av de sjuka och de som inte har sjukdomen i fråga) skall rapporteras. Egenskaper hos de sjuka påverkar sensitiviteten, och egenskaper hos dem utan sjukdomen i fråga påverkar specificiteten. Uppsättningen patienter skall motsvara en kliniskt realistisk situation.
• Inklusionen av patienterna skall beskrivas. En konsekutiv inklusion av patienter i en kliniskt realistisk situation är att föredra.
• Både sensitivitet och specificitet med tillhörande konfidensintervall skall redovisas. Positivt eller negativt prediktivt värde skall redovisas (observera att dessa är beroende av prevalens av sjukdomen i den undersökta gruppen). Likelihood-kvot eller annan beräkning som är oberoende av prevalensen skall redovisas.


En granskning har avslöjat oroväckande brister i studier om diagnostiska test inom cancerområdet.