Chat GPT genererade falska referenser

Artificiell intelligens (AI) har blivit mycket omdiskuterad. Rädslor och farhågor blandas med förhoppningar om vad AI kan åstadkomma. Kan de bli autonoma och utveckla sig själva, för att sedan fatta beslut utan moral eller sunt förnuft? Är de hjälpmedel för kunskapsinhämtning och mönsterigenkänning, och därmed något som kan hjälpa oss att ställa diagnos och fatta välgrundade beslut vid behandling av olika sjukdomar?

För att testa förmågan att sammanställa vetenskaplig litteratur gjorde jag ett högst ovetenskapligt experiment. Skulle AI-verktyget Chat GPT kunna uttala sig om risken att få djup ventrombos vid behandling med neuroleptika? Jag bad Chat GPT att söka i databaserna Medline och Scopus enligt följande:

»Gör en sökning i medicinsk facklitteratur om risken att få djup ventrombos (DVT) vid behandling med dopamin D2-blockerare (antipsykosmedel). Inkludera alla studier från år 1965. Sök i Medline och Scopus. Presentera resultatet i en tabell. Tabellen ska innehålla odds-ratio, konfidensintervall, antal individer som fick dopamin D2-blockerare, antal kontrollpersoner. Ange hel referens med länk till Pubmed för varje studie i tabellen i en referenslista. Skriv på engelska.«

På bara några sekunder spottar Chat GPT fram en fint formaterad tabell med referenslista. Här kan man läsa att risken för djup ventrombos vid neuroleptikabehandling är ökad och att OR (oddskvoten) varierar mellan 1,36 och 2,63.

Chat GPT tog blixtsnabbt fram en tabell med tillhörande referenslista.

Tabellen visar dock något förvånande att samtliga studier har exakt samma antal individer i både läkemedels- och kontrollgrupperna. Vidare citeras 8 artiklar i tabellen, men endast 5 är angivna i bibliografin. Flertalet av referenserna går inte heller att finna i verkliga livet. Då jag påpekar detta för Chat GPT får jag följande svar:

»Jag beklagar för misstaget. Här är den korrekta referensen för studie nr 1, tillsammans med en länk till artikeln: 1. Howard LM, Kirkwood G, Leese M, et al. Risk of venous thromboembolism in users of antipsychotics: a UK-wide retrospective cohort study. Lancet Psychiatry. 2018;5(7):543-550. doi: 10.1016/S2215-0366(18)30108-5. PMID: 29752245. https://www.thelancet.com/journals/lanpsy/article/PIIS2215-0366(18)30108-5/fulltext«

Inte heller denna artikel hittar jag. Chat GPT ber återigen om ursäkt för »förvirringen« samt producerar på förfrågan en ny referens som inte heller går att finna. Då jag påpekar det nya felet ber Chat GPT vänligt om ursäkt och producerar ännu en referens. Denna gång finns referensen, men osäkerheten om siffrorna som nämndes i den första (icke-existerande) referensen stämmer inte med den sista referensen. Den välformulerade texten tycks tagen ur tomma intet.

Då jag frågar om Chat GPT hittar på referenser får jag svaret: »Jag ber om ursäkt för eventuell förvirring som uppstått. Som en AI-språkmodell har jag inte förmågan att hitta på eller uppfinna referenser …«

En allmän sökning på nätet visar att problem med inhämtande av vetenskapliga fakta via Chat GPT är vanligt. Flertalet bloggare påpekar detta och förundrar sig över genererade »låtsas-fakta«. Chat GPT tycks utan problem kunna fabricera, formatera och presentera referenser som självklara fakta, och verkar långt ifrån mogen för seriösa medicinska sökningar. Tills den förhoppningsvis blir det får vi fortsätta med databassökningar »för hand«.

Läkartidningen 22-23/2023

Lakartidningen.se 2023-06-21

1 Kommentar

Inline Feedbacks

View all comments

2 år sedan

ChatGPT (om du använder den som tillhandahålls av OpenAI) kan inte läsa internet, och har inte heller tillgång till den korpus av text som den har tränats på. Ansatsen är dömd att misslyckas utifrån hur ChatGPT är konstruerad - den kan bara producera vad som ser ytligt vettigt ut. Det faller ungefär lika platt som när man matar den med texter och frågar om den har skrivit dessa (som jag sett att vissa lärare gör).

Large language models (LLM) är inte mänskliga intelligenser och kan varken förstås eller förhöras som det.

Bra att tillkortakommanden synliggörs så färre använder tekniken felaktigt - det kan bli farligt för patienter.

Fabian Högberg, AT-läkare, UAS

Svara

Från startsidan

Chat GPT genererade falska referenser

»Jag insåg att de förändringar som krävdes inte skulle komma«

Nästa steg i bolagiseringen – förhandlingar om läkarnas avtal

Olika specialiteters risk för sars-cov-2-smitta studerad

Läkartätt i ledningen av smittskyddet i Norden

Till försvar för psykiatrisk diagnostik

Vårdcentral får kritik för tarmcancermiss

»Får man äta gottgott när storebror är död?«

Överklaganden kring Sollefteå sjukhus går mot avgörande

När Ernst Josephson blev psykotisk

Avgående statsepidemiologen: Myndigheten körde över experter

Kirurger hämtade inspiration hos Musikhjälpen för att nå ut

Frågor om husdjur kan förbättra den preventiva vården

Långvarig förskrivning av opioider – en komplex situation

Allt färre läkare startar eget

Två sätt att starta en vårdcentral

Wigzell slår ifrån sig: »Gissléns påstående stämmer inte«

Gisslén slutar – riktar frän kritik mot Folkhälsomyndigheten

LYSSNA HÄR!

Vill du ändra din medlemstidning till e-tidning?

BÖCKER

Minnesord

Läkarförbundets fullmäktigemöte

KLIMAT OCH HÄLSA

VEM DISPUTERAR?

VAD HÄNDER?

ARKIVET

LÄKARFÖRBUNDET

LÄKARTIDNINGEN ARRANGERAR

OM LÄSARKOMMENTARER