Här nedan följer en maskininläst version av artikeln. Observera att det saknas styckeindelning, radbrytningar, mellanslag efter skiljetecken och att det kan förekomma stavfel.
Jonas
E Ludvigsson , med dr , barnkliniken , Universitetssjukhuset i Örebro , samt enheten för klinisk epidemiologi , Karolinska Universitetssjukhuset Solna ( jonasludvigsson@yahoo.com )SammanfattatVerkligheten kan ofta begränsa möjligheterna att bedriva forskning .En studie kan t ex stupa på att antalet inkluderade personer är för litet .Att känna till principen för stickprovsstorlek ( sample size ) kan då vara till god hjälp .Verkligheten begränsar ofta möjligheterna att bedriva forskning .De där 80 patienterna man hade tänkt inkludera visar sig vara omöjliga att rekrytera , kostnadsberäkningen för analyserna är alltför optimistisk och man tvingas begränsa antalet inkluderade patienter .Tyvärr kan detta leda till att patientantalet blir alltför litet och att studien saknar förutsättningar för att besvara de frågor vi ställt upp .Vi har för låg styrka ( power ) , dvs ingen rimlig chans att påvisa skillnad mellan jämförda grupper .En sådan studie riskerar att bli bortkastad , vi lyckades
ju inte besvara frågan !Stickprovsstorlek ( sample size ) är det antal patienter/människor/försöksdjur/observationer vi behöver inkludera i en studie för att kunna förkasta nollhypotesen .Nollhypotesen är alltid att det inte finns någon skillnad mellan jämförda grupper : t ex ingen skillnad i blodtryck mellan diabetiker och patienter med celiaki .Vanligtvis talar man dock om sin alternativa hypotes , t ex : Diabetiker har högre blodtryck än celiakipatienter .Stickprovsstorleken är beroende av flera faktorer , och fyra begrepp är av intresse för den som vill räkna ut stickprovsstorlek .Styrka ( power ) är chansen att hitta en sann skillnad , och vanligtvis väljer man värdet 80 procent .Av detta följer att man vid en styrka på 80 procent har 20 procents risk ( 1-0,80 ) att missa en sann skillnad mellan två grupper .Dessa 20 procent är också lika med risker för typ 2-fel ( risk att missa en sann skillnad ) .Signifikansnivå ( ofta angivet som P ) är risken att den skillnad man hittar mellan
sina grupper inte motsvaras av en sann skillnad mellan grupperna om vi tittat på alla individer med de undersökta egenskaperna ( typ 1-fel ) .För att förkasta nollhypotesen vill vi ha ett P-värde under 0,05 , men även lägre P-värden brukar redovisas i vetenskapliga arbeten .Variabilitet är spridningen eller variationen i uppmätta värden .Denna brukar ofta uttryckas som standardavvikelse ( SD ) .Standardavvikelsen kan skilja sig mellan friska ( ett slumpmässigt uppmätt blodsocker hos 100 friska personer varierar kanske mellan 3,5 och 6,5 ) och sjuka patienter ( varierar kanske mellan 2,9 och 18,3 ;större spridning än bland friska ) .Ibland måste man gissa sig till ett ungefärligt värde på spridningen ; man kanske är den första som genomför en viss typ av undersökning .I andra fall , t ex vid mätning av HbA1c , vet man kanske vilka medelvärden som är vanliga hos välinställda diabetiker och vilken spridning dessa värden brukar ha – spridningen mäts vanligtvis som standardavvikelse hos
variabler som har en jämn spridning ( normalfördelning ) .Minsta intressanta skillnad eller effekt uttrycks normalt som en skillnad mellan de undersökta grupperna och brukar motsvara en skillnad som man betraktar som » kliniskt viktig « .Ett fingerat exempel :Vi vill beräkna stickprovsstorleken ( antal patienter och kontroller som behövs ) för att visa på en skillnad i blodtryck mellan två behandlingsregimer .Vi utgår från standardvärden för styrka ( 80 procent ) och signifikansnivå ( 5 procent ) .För olika värden av styrka och signifikansnivå har man förbestämda koefficienter som används för att beräkna stickprovet .Koefficienten kallas för power index ( PI ) .För en styrka på 80 procent och en signifikansnivå på 5 procent är PI = 2,8 .Vi antar att en förändring av blodtrycket på 5 mm Hg är av intresse och att standardavvikelsen för blodtrycket är ca 12 mm Hg .N är antal patienter i vardera gruppen ( multipliceras med en faktor 2 för att få fram det antal patienter vi behöver inkludera
) .Den formel vi använder för ett s k oparat t-test ( två oberoende grupper ) skrivs :N = 2 × ( PI × SD/minsta intressanta skillnad ) 2 .I den här formeln finns styrka och signifikans ( PI ) , spridning ( SD ) och minsta intressanta skillnad .I vårt fall behöver vi :N = 2 × ( 2,8 × 12/5 ) 2 = 91 ( avrundat uppåt )Vi behöver alltså inkludera 91 personer i varje grupp ( sammanlagt 182 ) .Om spridningen ökar ( 12 blir 15 ) ökar också det antal personer som behövs .Om minsta intressanta skillnad minskar ( 5 blir 4 ) ökar också det antal personer som behövs .Givetvis finns det formler även för parat t-test och för s k ?2-test när man jämför proportioner .För dessa hänvisar jag till någon bok i statistik [ 1-3 ] .Det viktiga är inte att kunna stickprovsstorleksformeln utantill utan att känna till principerna för den :* Om vi vill påvisa små skillnader behöver vi ett stort stickprov , och om vi vill påvisa en stor skillnad behöver vi färre personer .* Om spridningen på våra mätvärden är liten
behöver vi ett litet stickprov ( mindre risk att gruppernas observerade värden ska överlappa ) .* Om vi vill vara säkra på att kunna påvisa en skillnad mellan två grupper kanske vi väljer styrkan 90 , då ökar PI och stickprovsstorlek .* Om vi vill minska risken för att göra ett typ 1-fel sätter vi kanske signifikansnivån till 0,01 , även då ökar PI och stickprovsstorlek .* Potentiella bindningar eller jävsförhållanden : Författaren har utan kostnad erhållit testversioner av SPSS Sample Power och JMP .