Hajpad AI delar forskarvärlden
Sedan textroboten Chat GPT lanserades har den tagit världen med storm. På några minuter kan den ge dig ett färdigt manuskript eller en anslagsansökan. Betyder AI-verktyget att forskarna nu äntligen kan ägna sig åt forskning i stället för slitgörat med att skriva, eller är det ett sätt att fejka sig till akademisk framgång? Läkartidningen har tittat närmare på nykomlingen på allas läppar.
»Skriv en vetenskaplig artikel om högt blodtryck hos medelålders kvinnor«. På mindre än en minut fylls skärmen med text: abstrakt, metodbeskrivning, resultat och diskussion. För den oinvigde ser det ut som vilken vetenskaplig artikel som helst – men den är helt påhittad och fabricerad av artificiell intelligens.
På kort tid har textgeneratorn Chat GPT väckt både fascination och förskräckelse – inte minst inom den akademiska världen. Utvecklingen har fått de medicinska tidskrifterna att reagera, och flera av dem har uppdaterat sina redaktionella policyer.
Science accepterar numera inte artiklar där Chat GPT eller någon annan AI har använts för att skapa innehåll. Nature är lite mer tillåtande, men understryker att det i så fall måste redovisas. Ingen av dem godtar dock att en AI står som medförfattare.
Professor Jonas F Ludvigsson ger textroboten i uppdrag att skriva en vetenskaplig artikel om celiaki. Foto: Ingrid Helander
Jonas F Ludvigsson, professor vid Karolinska institutet och barnläkare på Universitetssjukhuset Örebro, var tidig med att testa den nya tekniken. Läkartidningen tar hjälp av honom för att borra djupare i vad Chat GPT och liknande verktyg kan göra för forskare.
– Då ska vi se. Det här ska vi ha med, och det här förstås. Och så ska vi ha med lite sannolikhetsvärden, säger Jonas F Ludvigsson.
Han matar snabbt chattroboten med påhittade siffror och ber den att skriva en artikel om hur behandling med TNF-hämmare påverkar behovet av kirurgi hos patienter med Crohns sjukdom.
Sekunder senare börjar Chat GPT att spotta ur sig text.
– Det här är rimliga siffror, utifrån det som jag har gett den, säger han och pekar på konfidensintervall och P-värde.
För att göra det ännu mer trovärdigt lägger han till ytterligare information, bland annat uppgifter om hazardkvot.
– Ju mer information man petar in, desto mer text får man ut, säger Jonas F Ludvigsson.
Texten som chattroboten skrev på Jonas F Ludvigssons begäran.
Som ytterligare ett test ber han Chat GPT att skriva ett manus, i detta fall om förekomsten av celiaki i Sverige, utan att den får några siffror att gå på.
Återigen ser vi hur texten flödar fram över skärmen.
– Här hittar den ju på siffror. Chat GPT tror att det finns 35 000 fall av celiaki. Jag skulle säga att antalet diagnostiserade ligger någonstans kring 70 000–80 000. Men det som den skriver är ändå trovärdigt.
Chat GPT säger sedan att prevalensen är 80 på 100 000 personer. Där tycker Jonas F Ludvigsson att chattroboten lagt sig för lågt.
– Men de flesta som inte jobbar med det här varje dag hade ju aldrig sett att siffran 80 inte är helt korrekt.
Han konstaterar att det som Chat GPT gjort på en minut antagligen hade tagit de flesta forskare åtminstone en vecka att skriva.
Sedan Chat GPT lanserades har Jonas F Ludvigsson från forskarhåll hört både synpunkten att »det här är ju fusk« och att »vi forskare borde inte koncentrera oss på att skriva text, så det är jättebra om den gör jobbet«.
Själv ser han både risker och fördelar med den nya tekniken.
– Jag är väldigt kluven. Någon skulle förstås kunna låta Chat GPT skriva ihop hundra artiklar och få en våldsam publikationslista på kort tid. Det finns massor av tidskrifter som inte hade sett igenom det, säger Jonas F Ludvigsson.
Illustration: Erik Nylund
Det finns också en risk att Chat GPT kan leda forskningen fel. Chattroboten har visserligen tränat på stora mängder text, men bygger sina svar enbart på sannolikhet. Om en uppgift förekommer tillräckligt många gånger uppfattar Chat GPT den som sann, även om den inte är det.
Samtidigt ser Jonas F Ludvigsson stora möjligheter. Om Chat GPT tar ansvar för textproduktionen skulle forskare få mer tid över för andra delar av forskningen.
– Man kanske kan använda den för att göra grovjobbet, som att sammanfatta forskningsområden och skriva delar av manus och anslagsansökningar.
Ett dilemma är hur man ska se på den akademiska prestationen. Den som tar till sig tekniken kommer att producera mycket mer än den som inte gör det.
Det skulle till exempel kunna spela roll vid tillsättningen av en tjänst. Säg att två forskare gjort alla laboratorieförsök själva och har lika många manus, men att den ena tagit hjälp av Chat GPT vid skrivandet. Jonas F Ludvigsson frågar sig om deras prestationer ska väga lika tungt.
– Om man konsekvent använder sig av Chat GPT skulle man kunna skriva 200 manus om året. Då blir man ju professor på ett år.
Han tycker att det är rimligt att man redogör för om man har tagit hjälp av Chat GPT för att skriva en studie, till exempel i metoddelen. Han tror emellertid att många inte kommer att erkänna att de inte skrivit helt själva.
– De flesta kommer nog att låtsas som ingenting.
Nyligen lanserade företaget bakom Chat GPT, Open AI, ett verktyg för att kunna upptäcka om en text är AI-genererad eller inte. Genom att analysera texten gör verktyget en bedömning av hur stor sannolikheten är att Chat GPT har haft ett finger med i spelet. Hittills lämnar såväl den som liknande modeller mer att önska, men bättre lösningar kan vara i sikte.
Företaget Open AI arbetar just nu med olika strategier för att »märka« den genererade texten. Tanken är att programmera textgeneratorn till att peta in ord och skiljetecken i en specifik ordning för att skapa en hemlig kod som kan upptäckas av sökmotorer.
Men att skilja maskin från människa är bara en av utmaningarna. Även om Chat GPT många gånger imponerar med sin snabbhet och korrekthet, har den som sagt också uppenbara brister.
Som ett test ber Läkartidningen chattroboten att skriva en vetenskaplig studie om något uppenbart påhittat, nämligen »hästägg«.
Som ett sista test ber Läkartidningen chattroboten att skriva en vetenskaplig studie om något uppenbart påhittat, nämligen »hästägg«.
Den är genast med på noterna. Efter att ha levererat titeln »Hästäggens morfologi och biokemi« talar den bland annat om att en del av hästarnas reproduktionscykel är att lägga ägg och att det är något både ston och hingstar gör. Vi får också veta att häst-ägg kan ha en potential som kosttillskott eller livsmedel, men att mer forskning inom området behövs.
De flesta är överens om att Chat GPT är här för att stanna. Nyligen lanserades den nya och kraftfullare versionen GPT-4, och snart kan fler AI-verktyg, inklusive sådana som tränats specifikt på vetenskaplig litteratur, vara här.
– Det är uppenbart att forskare kommer att ha stor nytta av AI i framtiden. Frågan är bara hur vi ska hantera det, säger Jonas F Ludvigsson.
Läs även:
»Risken är att man är naiv och bara hoppar på teknologin«
»Den är inte en databas med fakta – utan enbart en statistisk modell«