När över 400 internationella hudläkare fick bedöma knappt 1 500 dermatoskopibilder av melanom lyckades de göra en korrekt bedömning om melanomen var invasiva eller inte (så kallade melanom in situ) i 76 procent av fallen. För en maskininlärningsalgoritm var motsvarande andel 74 procent.
Det här är ett steg på vägen att hitta bättre och mer sofistikerade verktyg för läkare i att bedöma melanomtjocklek, enligt en av forskarna bakom studien, Sam Polesie, docent i dermatologi och venereologi på Sahlgrenska akademin vid Göteborgs universitet, och även hudläkare.
Även om det är förhållandevis enkelt för hudläkare att upptäcka melanom, så är det betydligt svårare att bedöma tjockleken. När läkarna i den här studien ytterligare skulle specificera tjockleken i tre grupper (melanom in situ samt invasiva melanom under och över 1,0 mm) var bara 56 procent av bedömningarna korrekta.
Läkarnas erfarenhet eller utbildning hade ingen inverkan på hur väl de lyckades i sina bedömningar, något som Sam Polesie ser som ett tecken på hur svårt det är. En uppskattning har ändå betydelse för hur snabbt patienter ska prioriteras till den första operationen, och därför tror Sam Polesie att maskininlärningsalgoritmer kan fungera som ett värdefullt komplement i framtidens kliniska arbete.
– Det här är en utveckling som kommer och generellt är hudläkare positiva. Den stora utmaningen är ju att få dessa algoritmer att fungera i den kliniska vardagen, så de inte upplevs som konkurrerande utan snarare fungerar som ett beslutsstöd, säger han och fortsätter:
– Diskussionen som berör införande av maskininlärningsalgoritmer inom hudsjukvård handlar ofta om var vi ska placera dem i det kliniska flödet: före eller efter en hudläkares första bedömning? Placeras algoritmen före kan vi potentiellt öka sensitiviteten och få en tidsbesparande effekt, men då ändras också det kliniska flödet. Placeras den efter kan vi sannolikt öka specificiteten i våra bedömningar, men det blir ingen tidsvinst, utan kan till och med öka tidsåtgången eftersom det kan leda till motstridiga bedömningar som ska hanteras.
En begränsning i studien är att bilderna som läkarna tolkade alla utgjordes av melanom, medan hudläkare måste ta hänsyn till flera andra differentialdiagnoser i en klinisk miljö. En annan är att algoritmen jämfördes mot hudläkarnas samlade bedömning.
– Vårt nästa steg är att utvärdera algoritmer i prospektiva studier och då jämföra hur algoritmer presterar i jämförelse med individuella hudläkares bedömningar, säger Sam Polesie och fortsätter:
– Det är ju först då som vi kan börja uttala oss om hur dessa algoritmer kan docka in i sjukvården. Min förhoppning är att verktyg som dessa kommer att vara tillgängliga inom svensk hudsjukvård inom 5 till 10 år.
Studien publicerades i tidskriften Journal of the European Academy of Dermatology and Venereology, JEADV, och genomfördes i samarbete med forskare vid Medical University of Vienna i Österrike.