BMJ har under våren 2005 haft en artikelserie om kohortstudier [1-3]. Man påpekar att kohortstudien kan ge värdefull information men att det gäller att se upp med brister i studiens design.
I seriens första artikel [1] beskrivs de principiella skillnaderna mellan kohortstudien och den randomiserade prövningen, vidare kommenterar man olika typer av jämförelsegrupper i kohortstudien och risken för urvalsbias (selection bias).
Randomiserade prövningar anses allmänt ha det största vetenskapliga bevisvärdet och är oftast att föredra när man vill studera effekten av en aktiv intervention. Likväl finns det plats även för icke-randomiserade prövningar. Praktiska svårigheter, men även etiska dilemman, kan göra det svårt att belysa ämnen såsom »rökning och cancer« inom ramen för en randomiserad prövning. Kohortstudien gör det möjligt att följa många individer under lång tid med avseende på flera utfall, och ibland mycket sällsynta sådana. Man kan också studera potentiellt farliga exponeringar, till exempel asbestintag eller betydelsen av akrylamid i dricksvattnet. Kohortstudien lämpar sig alltså väl för att studera riskfaktorer där en aktiv intervention inom ramen för en klinisk prövning inte är möjlig.

Klinisk prövning i grunden en kohort
Den kliniska prövningen är dock i grunden en kohortstudie. I bägge fall studerar man utfallet i grupper som utsattes för en exponering eller inte utsattes för en viss exponering. Ett grundelement i bägge studier är uppföljning framåt i tiden från en exponering till ett utfall. Skillnaden består bland annat i att det alltid är studieledaren som tilldelar försökspersonerna en exponering eller intervention (så kallad allokering) i den kliniska prövningen utifrån en randomisering. Slumpmässigheten i själva randomiseringen leder till att den studerade effektvariabeln får en väldefinierad, känd statistisk fördelning under nollhypotesen.
I kohortstudien är det inte studieledaren som avgör vem som exponeras eller ej; det är ofta just försökspersonen. Fördelen med att randomisera interventionen är att man minskar risken för urvalsbias och confounding [4]. Confounding är en situation när effekten av en exponering eller intervention missbedöms genom inverkan av en eller flera faktorer som själva är riskfaktorer för utfallet och som blivit ojämnt fördelade mellan den exponerade gruppen och jämförelsegruppen (se även faktaruta 1 i artikeln av Rochon och medarbetare [1]).
Randomiserad intervention leder till att de grupper som ska jämföras blir mer homogena med avseende på såväl kända störfaktorer (t ex kön, när vi studerar risk för bröstcancer) som okända störfaktorer (t ex konsumtionen av morötter om denna skulle vara kopplad till risken att drabbas av hjärtinfarkt och det är risk för hjärtinfarkt efter intag av annan grönsak vi vill studera) [5]. Vid kohortstudien däremot kan störfaktorer fördela sig snett mellan interventionsgrupp och jämförelsegrupp, vilket påverkar resultatet.

Rättvis jämförelse
Rochon och medarbetare diskuterar också val av jämförelsegrupp vid kohortstudier [1]. I idealfallet ska individer som erhållit en intervention som grupp betraktat vara identisk med gruppen som ej erhållit en intervention utom med avseende på själva interventionen [1]. Det kan vara svårt att finna en sådan jämförelsegrupp. Om patienter som erhåller demensmedicin oftare bryter benet, beror det då på demensmedicinen eller på att de har demens? I det aktuella fallet måste förstås både gruppen med och gruppen utan demensmedicin lida av demens för att jämförelsen ska bli rättvisande.
Detta kan leda till betydligt mindre studiegrupper och lägre statistisk styrka. Det är lättare att identifiera friska människor utan demensmedicin (i själva verket de allra flesta svenskar) än individer med demens som inte erhåller demensmedicin. Många inklusionskriterier gör det också svårare att generalisera resultaten till stora grupper.

Störande faktorer
I seriens andra artikel [2] redogör Mamdani och medarbetare för begreppet confounding. Störfaktorer växlar mellan olika studier. I en studie av höftfrakturer hos patienter med demensmedicin kan förekomsten av demens vara en störfaktor, i en annan kan det vara ålder.

För att en faktor ska definieras som en störfaktor måste två kriterier uppfyllas:
• Störfaktorn är en oberoende riskfaktor för utfallet. Hög ålder är kopplat till risken för höftfraktur. Alltså skulle ålder kunna vara en störfaktor i en studie av demensmedicin och höftfrakturer.
• Fördelningen av störfaktorn ska skilja sig mellan interventionsgruppen och jämförelsegruppen. Om deltagarna i interventionsgruppen (med demensmedicin) är äldre än de i jämförelsegruppen (utan demensmedicin) så kan det ju vara såväl demensmedicinen som den höga åldern som förklarar en ökad risk för höftfrakturer i interventionsgruppen. Notera att den genomsnittliga åldern inte måste skilja sig mellan interventionsgrupp och jämförelsegrupp för att åldern ska vara en störfaktor; åldersfördelningen kan också spela roll! Andelen extremt gamla kanske skiljer sig mellan grupperna (Interventionsgruppen innehåller kanske 4 personer över 105 år varav alla löper en stor risk att bryta sig; men genomsnittsåldern i såväl interventionsgrupp som jämförelsegrupp kan vara densamma: 87 år).

När man läser en kohortstudie är det viktigt att bilda sig en uppfattning om huruvida artikelförfattarna försökt att identifiera potentiella störfaktorer. Mamdani och medarbetare ger också tips på metoder som kan användas av forskare, för att redovisa eventuell confounding.

Tre vanliga sätt att minska störfaktorinverkan
I seriens sista och tredje artikel [3] beskriver Normand och medarbetare statistiska metoder för att hantera confounding. Artikelförfattarna noterar att det finns tre vanliga sätt att minska confounding: matchning av deltagare i interventionsgrupp och jämförelsegrupp, regression och stratifiering. Artikelförfattarna koncentrerar sig på regression och stratifiering då matchning kan betraktas som ett specialfall av stratifiering [6]. Bägge metoderna har sina för- och nackdelar.
Regressionsanalysens främsta fördel är att alla studiedeltagare, förutsatt att de har fullständiga data, kan bidra till analysen. Det finns lättillgängliga statistiska redskap för att utföra analyserna och de flesta forskare är välbekanta med tekniker som till exempel linjär och logistisk regression. Men regressionsanalysen vilar på flera antaganden vilka inte alltid är giltiga. Ett är att man utgår från att effekten av en intervention är densamma över flera strata, till exempel att effekten av alkohol för risken att drabbas av stroke är densamma bland såväl män som kvinnor. Om så inte är fallet, talar man om effektmodifiering. Effekten av alkohol modifieras i detta fall av könet hos studiedeltagarna. Detta kan man ta hänsyn till genom att skapa en särskild variabel som är en produkt av såväl kön som alkoholkonsumtion.

Justerade och ojusterade resultat jämförs
När man studerar resultaten av en regressionsanalys är det viktigt att jämföra resultat som ej är justerade för potentiella störfaktorer (unadjusted) och resultat som är justerade för potentiella störfaktorer (adjusted). I det fall resultaten skiljer sig väsentligen åt kan man förmoda att det finns en obalans vad gäller störfaktorerna mellan grupperna (detta illustreras väl i tabell 1 i Normands artikel [3]). Det är dock viktigt att hålla i minnet att även efter en bra justering för störfaktorer kvarstår ofta ett visst mått av confounding.

Subgrupper
Vid stratifiering delar man in studiedeltagarna i subgrupper och studerar sambandet mellan till exempel alkohol och risken för stroke i var grupp för sig (till exempel kvinnor för sig; män för sig – eller personer under 70 år för sig; personer 70 år eller äldre för sig). Målet är att skapa subgrupper som har en jämnare fördelning av störfaktorer. I exemplet ovan kan kön respektive ålder ha varit störfaktorer.
Problemet med stratifiering är att det minskar studiegruppernas storlek vilket ger en lägre statistisk styrka och minskad chans att påvisa faktiska skillnader. Dessutom är stratifiering ju inte en garanti för att man verkligen får en jämnare fördelning av andra riskfaktorer än den man stratifierar för.

Läsvärt
Artikelserien, som är väl värd att läsa, avslutas med konstaterandet att såväl randomiserade prövningar som kohortstudier har sina svagheter. Det är viktigt att se upp för urvalsbias och confounding när man designar egna, och studerar andras, kohortstudier.
*
Potentiella bindningar eller jävsförhållanden: Inga uppgivna.