Sammanfattat
De normala, eller »hälsorelaterade«, referensintervallen beräknas från mätningar hos friska individer med samma biologiska variationsfaktorer, exempelvis ålder och kön, som hos de patienter man önskar undersöka. Valet av referensindivider avgörs av kriterierna för avsaknad av organpåverkan av relevans för kroppens omsättning av den aktuella mätstorheten.
Diagnostiska beslutsgränser har av tradition varit desamma som referensintervallsgränserna, men med förbättrade metoder och ökade kunskaper om koncentrationsförändringar vid sjukdom har på senare tid beslutsgränser definierats som kan skilja påtagligt från referensintervallsgränserna.
Skilda beslutsgränser kan vara aktuella för en och samma mätstorhet beroende på frågeställningen, eftersom beslutsgränser definieras utifrån patientpopulationen.
Prognostiska beslutsgränser kan förväntas få ökande betydelse för val av medicinska åtgärder.
Vi bedömer att den kliniska nyttan av mätningarna skulle vara större, och svarsbedömningen riskera mindre missförstånd, om beslutsgränser ingår i svarsrapporterna när de avviker från referensintervallens gränser.
En laboratorieundersökning ska alltid beställas med klar indikation och frågeställning tex för att utesluta eller bekräfta misstänkt diagnos eller för att följa effekterna av behandling. Resultaten ska alltid bedömas tillsammans med sjukhistorien och den kliniska bilden. Vid bedömningen av mätvärdena utgår man från i förväg specificerade gränsvärden, som benämns beslutsgränser och referensintervallsgränser, begrepp som inte sällan förväxlas.
Beslutsgränser
Med medicinsk (eller »klinisk«) beslutsgräns (åtgärdsgräns, decision limit, decision value, decision point [1]) brukar vi avse gränsvärdet (gränsvärdena) för koncentrationen av en komponent med avseende på tolkning och en eller flera åtgärder, som
– stöd för eller emot en diagnos
– att genomföra fortsatt utredning
– att påbörja behandling
– kontroll av behandlingseffekt
– att värdera prognos och därmed besluta om behandlingsintensitet och läkemedelsdosering.
Algoritmer (»beslutsträd«) för medicinska beslutsstödssystem, som en diagnostisk utredning eller genomförande av en behandling, bygger på en serie beslutsgränser. Medan termen »beslutsgräns« antyder ett medicinskt ställningstagande är termen »brytpunkt« (cut-off, cut-off value, cutpoint) möjligen mer neutral. Mätningen av natriuretiska peptider illustrerar möjligheten att med hjälp av en biokemisk mätning med hög diagnostisk sensitivitet öka kostnadseffektiviteten vid användning av kostnadskrävande patientbundna undersökningar, här ekokardiografi. Dessa undersökningar bör i första hand utföras hos de patienter där man erhåller mätvärden över beslutsgränsen. Ett annat exempel är mätning av astrogliaproteinet S100B i serum som beslutsunderlag för datortomografisk mätning vid skallskada [2].
Av tradition har man för kliniskt kemiska mätningar valt att använda referensintervallsgränserna som beslutsgränser. I och med tillgången till ökade diagnostiska möjligheter som följd av nya eller förbättrade mätmetoder, liksom ökade kunskaper från epidemiologiska studier, ser vi emellertid allt fler exempel på val av andra beslutsgränser än referensintervallsgränserna. Det kan exempelvis röra sig om biomarkörer för sjukdom, riskfaktorer för sjukdom, tumörmarkörer, hormoner, markörer för organskada och övervakning med laboratoriemätningar i intensivvård.
Diagnostiska beslutsgränser
Mätning av B-hemoglobin är en klassiker inom laboratoriemedicinen, bland annat som följd av att sänkt koncentration kan vara ett uttryck för många skilda sjukdomar. Trots detta finns ingen konsensus om beslutsgränsen för diagnosen »anemi« bör vara 2,5- eller 5-percentilen av fördelningen av mätvärdena hos friska. Den senare uppfattningen framfördes nyligen efter en granskning av två stora amerikanska databaser [3]. Möjligen kan det vara motiverat med en ännu högre beslutsgräns för utredning mot bakgrunden av påvisande av sänkt fysisk och mental kapacitet hos äldre med koncentration av B-hemoglobin inom nedre delen av referensintervallet [4, 5].
Inför insättning av behandling för att sänka koncentrationen av S-kolesterol värderas patientens hereditet, kön och östrogenstatus, förekomst av vissa sjukdomar som diabetes mellitus och kardiovaskulär sjukdom, njursjukdom samt blodtryck och andra riskfaktorer för ateroskleros, liksom koncentrationerna av HDL-kolesterol och LDL, alternativt apoliproteinerna A1 och B. Övre referensintervallsgränsen för S-kolesterol för personer >50 års ålder är 7,8 mmol/l [6]. För personer med hög kardiovaskulär risk och vid sekundärprevention rekommenderar Läkemedelsverket på goda kliniska grunder beslutsgränsen 5,0 mmol/l för behandling med statiner (4,5 mmol/l för högriskgrupper). Risken är då att många friska äldre personer, tex äldre kvinnor, skräms till kolesterolsänkning. Statiner har många biverkningar, och hos personer över 85 år är hög koncentration av S-kolesterol förenlig med ett längre liv [8]. Apolipoproteinerna A1 och B är sannolikt att föredra som biomarkörer för kardiovaskulär risk, men full enighet har ännu inte nåtts om beslutsgränser för lipoproteinkoncentrationer eller koncentrationskvoter inför och under behandling [9].
För tumörmarkören S-PSA ansågs länge den övre referensintervallsgränsen vara 4,0 µg/l. Mot bakgrunden av den med åldern tilltagande prevalensen av prostatahyperplasi diskuterades åldersstratifiering, innebärande ökning med 1,0 µg/l per dekad. Som alternativ infördes beslutsgränsen 7 µg/l. Under senare år tillämpas referensintervallsgränsen 3,0 µg/l eller något lägre. Sannolikheten att man ska missa några fall är låg om koncentrationen är 2,0 µg/l, men för att vara rimligt säker bör S-PSA ligga under 1,0 µg/l [10]. Det är uppenbarligen angeläget att det skapas en konsensusuppfattning rörande beslutsgränser för S-PSA från sakkunnigt urologiskt och kliniskt kemiskt håll. En viktig roll spelar de ökade erfarenheterna från bla radikal prostatektomi, det vill säga de terapeutiska möjligheterna kan ha stor betydelse för valet av beslutsgränser.
Om reglerhormonet TSH (tyreotropin) har det också varit en livlig debatt i dessa frågor. Den nedre referensintervallsgränsen för friska har länge ansetts vara omkring 0,4 mIE/l. När mätmetoder som kunde fastställa låga TSH-koncentrationer blev tillgängliga användes denna gräns till en början som beslutsgräns för diagnoserna tyreotoxikos och hypertyreos. Vid undersökning av oselekterade patientpopulationer visade det sig emellertid att allmänsjukdom, »nonthyroidal illness«, var en långt vanligare orsak till sänkta TSH-värden än tyreotoxikos/hypertyreos [11]. Som beslutsgräns bör därför användas gränsen mot »supprimerat TSH«, det vill säga laboratoriets »funktionella känslighet« vid TSH-mätningen. Denna är som regel lägre än 0,02 mIE/l [12].
Den låga beslutsgränsen för TSH är alltså påtagligt skild från den nedre referensintervallsgränsen. Debatten fortsätter när det gäller den övre referensintervallsgränsen och dess värde som beslutsgräns [13-16]. Man ser, exempelvis, inte sällan förhöjda värden under lång tid efter tillfrisknande från allmänsjukdom. För flertalet aktuella metoder ligger referensintervallsgränsen mellan 3 och 4 mIE/l. En så pass låg gräns som 2,5 mIE/l föreslogs i ett internationellt konsensusdokument [12], men det experimentella stödet har visat sig vara ringa. Oavsett koncentrationen motsvarande den övre referensintervallsgränsen finns emellertid förslag till två skilda beslutsgränser, se nedan.
De natriuretiska peptiderna från hjärta är hormoner som påverkar såväl hjärtat som en rad organ. Via hemodynamiska effekter och direkta effekter på hjärtcellernas ämnesomsättning påverkas hjärtats funktion. Peptidernas koncentrationer i blod förefaller vara känsliga markörer för bristfällig hjärtfunktion. Frågan om lämpliga beslutsgränser för diagnostiken av hjärtsvikt är emellertid för närvarande kontroversiell [17, 18]. Beslutsgränserna för dessa peptider förväxlas inte så sällan med referensintervallsgränserna. Som exempel kan nämnas missuppfattningen att det gränsvärde för BNP, 100 ng/l, som i en stor multicenterstudie befanns ha högst diagnostisk riktighet vid undersökning av patienter som sökt akutmottagning för akut dyspné, skulle vara den övre referensintervallsgränsen hos friska individer [19]. Denna missuppfattning kan leda till att den diagnostiska sensitiviteten av mätningarna felbedöms [20]. I själva verket är referensintervallsgränsen en femtedel till en tredjedel av denna beslutsgräns, varierande med kön och ålder [21, 22].
I hjärtinfarktsdiagnostiken finns rekommendationen att använda 99-percentilen för troponinkoncentrationen, alternativt den (högre) koncentration där den totala imprecisionen (variationskoefficienten, CV) är 10 procent[23, 24].
Som framhålls nedan har man för fP-glukos två beslutsgränser i primärvården, för diagnos av diabetes mellitus respektive för nedsatt glukostolerans/fastehyperglykemi. Båda gränsvärdena är skilda från referensintervallets övre gräns.
Strikt kontroll av glukoshalten i plasma eller serum hos patienter i intensivvård, inte bara hos diabetiker, har visats kunna ge betydande humanitära och ekonomiska vinster. Hög tillgänglighet av laboratoriemätningarna är därför betydelsefull. Ännu råder emellertid ingen konsensus rörande övre eller nedre beslutsgränser för glukoskoncentrationerna och deras relation till de hälsorelaterade referensintervallen [25, 26].
Ett särskilt drastiskt exempel på en mätstorhet där det finns behov av beslutsgränser i brist på valida hälsorelaterade referensintervall är 25-hydroxivitamin D. Populationsstudier från många håll i världen visar referensvärden som allmänt anses inkludera en betydande andel mätvärden från personer med D-vitaminbrist. Ännu finns emellertid ingen konsensus om adekvata gränsvärden [27, 28].
Sammanfattningsvis har det i flera fall föreslagits diagnostiska beslutsgränser som är påtagligt lägre och/eller högre än referensintervallsgränserna för den aktuella mätstorheten.
Referensintervall
Referensintervallsgränserna, vilka beräknas på basen av mätvärdena (»referensvärdena«) för en grupp referensindivider, helst 120 eller fler [29], är tillsammans med resultaten från kliniska studier av patienter med den aktuella sjukdomen eller rubbningen utgångspunkter för att definiera beslutsgränser för det aktuella tillståndet. Referensindividerna ska vara friska från detta tillstånd och också från andra tillstånd med inverkan på den undersökta komponenten [30]. De bör ha samma ålder, kön, läkemedelsintag och andra biologiska variationsfaktorer som de patienter som kan vara aktuella [31, 32]. Provtagning bör ske på ett standardiserat sätt, exempelvis med avseende på vila och kroppsläge.
Variation med åldern är ett vanligt fenomen. I Skåneundersökningen [33] fann man för fS-glukos, exempelvis, som övre referensintervallsgräns 6,5 mmol/l för individer 20–50 år och 7,2 mmol/l för individer 50–80 år. I det nordiska referensintervallsprojektet NORIP [6] fann man en övre gräns 6,3 mmol/l, förenligt med en lägre medelålder i referenspopulationen. Ett problem som vi stött på är att man på många håll rutinmässigt lämnar ut kliniskt kemiska analysresultat tillsammans med NORIPs referensintervallsgränser. Det betyder exempelvis, att övre referensgränsen för fP-glukos anges till 6,3 mmol/l och att alla svar som är högre får en varningsflagga. Beslutsgränsen är ju emellertid 7,0 mmol/l för diagnostik av diabetes, och det framgår inte av svaren.
Vi bedömer att den kliniska nyttan skulle vara större, och svarsbedömningen riskera mindre missförstånd, om beslutsgränserna ingår i svarsrapporterna när de avviker från referensintervallens gränser.
I samband med genomgången av mätvärdena för referensindividerna bör outlier-värden granskas med statistiska metoder [29] och/eller genom genomgång av den eller de aktuella individernas kliniska karakteristika. Grafisk illustration av fördelningen av mätvärdena bör också göras, bla som hjälp att finna outlier-värden, i form av histogram eller presentation av de individuella mätvärdena.
Särskilt gäller detta för mätstorheter som berör tillstånd som är vanligt förekommande i asymtomatiskt skede. I Skåneundersökningen såg man ett antal individer med tidigare icke-diagnostiserad diabetes mellitus [33]. Likaså kunde flera individer med icke-diagnostiserad primär hypotyreos ses vid Mölnlyckeundersökningen av tyreoidea i primärvård [34]. Hög prevalens av atrofisk gastrit hos äldre kan påverka referensintervallen för S-kobalaminer [35].
Avvikande födointag kan ibland ha överraskande effekter, som ökning av mätvärdena för S-ferritin [36]. För vissa mätstorheter kan även nyligen genomgången sjukdom spela roll. S-TSH-ökning kan ses lång tid efter tillfrisknande från akut allmänsjukdom [15]. S-ferritinökning ses flera veckor efter även lindrig infektion [37]. Betydelsen av en noggrann anamnes för selektionen av referensindivider kan således inte överskattas.
Ändringar av gängse referensintervalls-/beslutsgränser på basen av ökade kunskaper från undersökning av referensindivider kan leda till ändringar av mätmetodens diagnostiska sensitivitet och specificitet för specifika diagnoser. Som exempel kan nämnas det nordiska referensintervallsprojektet [6, 38]. Kritik riktades mot den föreslagna referensintervallsgränsen för ALAT (alaninaminotransferas), där tidigare gällande 0,6 µkat/l för kvinnor och 0,8 µkat/l för män föreslogs höjas till 0,75 respektive 1,1 µkat/l, väsentligen oberoende av värdet för BMI [39]. Av 45 patienter med mätvärden under de nya gränsvärdena befanns 44 patienter ha fettinlagring i levern [40]. Som resultat av denna undersökning föreslog författarna införande av beslutsgränserna 0,6 µkat/l för kvinnor och 0,8 µkat/l för män. Vid högre katalytiska ALAT-aktiviteter än dessa gränsvärden föreslogs »medicinska överväganden«, det vill säga fortsatt utredning med tex leverbiopsi [40, 41].
Som ett annat exempel på att ändring av beslutsgränser kan ha stora praktiska konsekvenser för tolkning och kliniskt handlingssätt kan nämnas gamma-glutamyltransferas (S-GT) som markör för alkoholmissbruk [42]. Gemensamt nordisk övre referensintervallsgräns för kvinnor 40 år har föreslagits vara 0,75 µkat/l, för män >40 år 1,9 µkat/l. Möjligheterna att påvisa sjukdomstillstånd som kan vara av relevans för selektionen av referensindivider, ökar med tillgången till nya metoder. Det kan röra sig om allt känsligare biomarkörer på organpåverkan eller noninvasiva undersökningsmetoder som ultraljudsundersökningar och avbildningstekniker. Det torde nu vara allmänt accepterat att förhöjd koncentration av antikroppar mot tyreoperoxidas (TPOAb) bör vara uteslutningskriterium vid undersökning av referensintervallet för S-TSH [15]. Detta visades först i en populationsundersökning av äldre [43]. I en aktuell undersökning av N-terminalt proBNP [44] (se även artikeln på sidan 2071) visas betydelsen av en förbättrad karakterisering av referensindivider, här med hjälp av ekokardiografi för påvisande av kardiella sjukdomstillstånd.
Skilda beslutsgränser beroende på frågeställning
Medan referensintervallsgränser bestäms av referenspopulationens sammansättning, det vill säga utifrån mätvärden för friska individer, avgörs beslutsgränser ibland av mätvärden för patienter och utifrån frågeställningar som är aktuella för skilda sjukdomsgrupper. Mätning av P-D-dimer utförs för att utesluta klinisk misstanke om tromboembolisk sjukdom. Därför blir endast en beslutsgräns aktuell. Två beslutsgränser används däremot för fP-glukos. Gränsvärdet är 7,0 mmol/l för diagnos av diabetes mellitus, medan gränsvärdet 6,1 mmol/l används för att avgöra förekomst av nedsatt glukostolerans/fastehyperglykemi [45]. För TSH har beslutsgränsen 2,0–2,5 mIE/l föreslagits för vidare utredning (i första hand mätning av antikroppar mot tyreoperoxidas i serum, S-TPOAb) och beslutsgränsen 10 mIE/l för substitutionsbehandling med tyreoideahormon [15]. En av anledningarna till att föreslå den lägre beslutsgränsen var resultatet från en undersökning av en primärvårdspopulation. Här iakttogs en stigande prevalens av TPOAb-positiva patienter med ökande koncentrationer av TSH inom referensintervallet, särskilt från detta TSH-intervall och uppåt [46]. En annan anledning var fynden från en 20-årsuppföljning av den så kallade Whickhamstudien [47], se nedan.
För natriuretiska peptider förekommer i litteraturen flera skilda beslutsgränser vid misstanke om hjärtsvikt, dels för att med hög sannolikhet utesluta diagnos respektive ställa diagnos, dels koncentrationen med högst diagnostisk riktighet, det vill säga optimal kombination av diagnostisk sensitivitet och specificitet [17, 48].
Prognostiska beslutsgränser
Vid en 20-årsuppföljning av tyreoideaundersökningarna i en population befanns risken för utveckling av hypotyreos öka från och med S-TSH 2,0 mIE/l [47]. Detta är ett tidigt exempel på att beslutsgränser kan vara motiverade på basen av mätvärdens prognostiska innehåll, exempelvis för klinisk uppföljning, för insättning och val av behandling samt när man vill upptäcka individer i en »frisk« population med ökad risk att utveckla allvarlig sjukdom: diabetes, kardiovaskulär sjukdom, tumörsjukdom, endokrin sjukdom etc.
Prognosbaserade beslutsgränser är aktuella också för de natriuretiska peptiderna. Det finns nämligen en omfattande litteratur kring de natriuretiska peptidernas prognostiska värde [49-52], och peptidmätningar har hos patienter som sökt akut för dyspné varit prognostiskt överlägsna ekokardiografiska mätningar [53].
Vid akuta koronarsyndrom befanns BNP-värden över en beslutsgräns som var 2–4 gånger högre än den övre referensintervallsgränsen predicera 30-dygnsmortalitet med hög sannolikhet [54]. En prognosbaserad beslutsgräns för N-terminalt proBNP hos patienter med hjärtsvikt, avseende 1-årsmortalitet, beskrevs av Januzzi och medarbetare [55]. Gränsvärdet var ca 5 gånger högre än övre referensintervallsgränsen [44] och ca 3 gånger högre än gränsvärdet för uteslutning av diagnosen hjärtsvikt [56]. Peptidkoncentrationerna vid utskrivning från sjukhusbehandling av hjärtsvikt har visats ha högre prognostiskt värde för ny inläggning eller död än koncentrationerna i det akuta skedet. Mot bakgrunden att mätning av natriuretisk peptid av B-typ då visats ha högre prognostiskt värde än klinisk bedömning och ekokardiografisk mätning av vänsterkammarfunktionen kan det finnas anledning att överväga rutinmässig mätning av natriuretisk peptid av B-typ vid utskrivningen av hjärtsviktspatienter [57]. Ett rationellt val av prognostiska beslutsgränser blir här av stor betydelse.
Beslutsgränsers dynamiska natur
Beslutsgränser vid kontroll för kardiovaskulära riskfaktorer illustreras av en undersökning av >250 000 patienter vid Kaiser Permanente of Northern California [58]. För bedömning av diabeteskontroll användes gränsvärdena 7,0 procent och 8,0 procent för B-HbA1c för att ange god respektive dålig kontroll. För motsvarande blodtrycksbedömning användes 140/90 mm Hg och 160/100 mm Hg för patienter utan diabetes eller organskada; 130/85 mm Hg respektive 140/90 mm Hg för patienter med diabetes eller motsvarande organskada. För bedömning av S-LDL-kolesterol användes skilda beslutsgränser vid tre skilda risknivåer, definierade från riskfaktormönstret. Två andra artiklar i samma tidskriftshäfte beskriver prevalensen av »out of control« och diskuterar de kliniska konsekvenserna, liksom bakomliggande orsaker.
Artiklarna belyser beslutsgränsers dynamiska natur, det vill säga att flera skilda beslutsgränser kan vara aktuella för en och samma indikation, som insättande av viss behandling, när hänsyn tas till en eller flera andra faktorer av betydelse.
Riktvärden för kvalitetssäkring
Beslutsgränser har ett särskilt intresse för kliniska kemister i det avseendet att gränsvärdena med fördel utgör riktvärden för extern och intern kvalitetssäkring. Resultaten från dessa mätningar bör redovisas i vetenskapliga rapporter [59], och fynden för koncentrationerna kring beslutsgränserna har störst intresse för bedömningen av mätosäkerheten för de kvantitativa mätningar som ingår i redovisade studier. Extern kvalitetssäkring är också betydelsefull för att klarlägga nivåskillnader mellan skilda metoder, också viktig information vid vetenskaplig redovisning.
Kritik kan riktas mot användning av beslutsgränser utan hänsynstagande till mätosäkerheten [60, 61]. Laboratoriernas redovisning av mätosäkerheten tillsammans med angivelse av beslutsgräns(er) kan därför nyansera mottagarens bedömning av mätvärden.
Metrologiska förutsättningar
Mättekniska förutsättningar för att beräkna valida referensintervallsgränser och föreslå rationella beslutsgränser är: tillgång till goda mättekniker, gemensam kalibrering och väl genomförd kvalitetskontroll, såväl intern som extern. Här föreligger stor variation mellan skilda provkomponenter. Exemplen glukos å ena sidan, och BNP och andra immunkemiska mätningar å andra sidan, illustrerar detta tydligt. Det finns referensmetoder för glukos, till och med absoluta metoder. Detta gör att alla metoder och tekniker kan bli samkalibrerade och ge identisk diagnostisk sensitivitet och kompletta förutsättningar för gemensamma beslutsgränser och referensintervallsgränser. Frågeställningen är mycket svårare avseende komponenter som man mäter med immunkemiska mätmetoder, baserade på antikroppar vilka binder olika epitoper och där det immunkemiskt reaktiva materialet i patientproven är heterogent. Samarbete över nationsgränser, och mellan skilda diagnostikaföretag, är här nödvändigt [62].
Samarbete mellan klinik och laboratorium
Ett gott samarbete mellan klinik och laboratorium är också allt mer nödvändigt för undersökning av referensintervall och beslutsgränser. Detta är en följd av utvecklingen av nya metoder för sjukvårdsmässigt bruk och ökad tillgänglighet till laboratoriemätningar i sjukvården. Laboratoriemätningar får en ökad användbarhet om vi gemensamt formulerar beslutsgränser för de skilda mätningarna i skilda situationer. För att mätvärden i skilda studier ska bli jämförbara mellan laboratorier krävs deltagande i gemensam extern kvalitetssäkring. I de fall sådan ännu inte finns allmänt tillgänglig i vårt land – som för närvarande är fallet när det gäller natriuretiska peptider – bör kontrollmaterialet för den interna kvalitetssäkringen kunna ställas till förfogande även för andra forskargrupper. Initiativ för att åstadkomma detta bör kanske komma från de vetenskapliga organisationerna inom respektive forskningsområde.
Potentiella bindningar eller jävsförhållanden: Inga uppgivna.