Under förra århundradet gjordes stora forskningsansträngningar för att i detalj beskriva enskilda molekyler och deras relation till sjukdomar. Man fann att många vanliga sjukdomar som allergi, cancer och diabetes var komplexa, dvs att de inte berodde på enskilda gener utan på ändrad balans mellan många samverkande gener och miljörelaterade mekanismer. Detta stöddes av studier med ny genomteknik, som visade att 100-tals gener var inblandade vid sådana sjukdomar [1, 2].


Individuella variationer i komplexa sjukdomar
Det är en vardagserfarenhet att människor med samma sjukdom kan bli olika sjuka. Under tex en influensaepidemi som orsakas av samma virus blir vissa individer mycket sjuka och andra lindrigt eller inte alls drabbade. Liknande individuella variationer gäller för alla komplexa sjukdomar. En förklaring till detta är genetiska olikheter.
Ett internationellt projekt, HapMap, har analyserat genomen hos 269 människor från olika befolkningar. Genomen hos olika individer visar stor överensstämmelse; skillnaderna ligger i bla att enstaka baser i bestämda positioner i genomet normalt varierar. Sådana variationer kallas för singelnukleotidpolymorfismer (SNP). HapMap-projektet ger en karta över sådana SNP.
Man beräknar att människan har cirka 10 miljoner SNP. Dessa skiljer sig mellan och inom olika befolkningsgrupper [3]. Skillnaderna återspeglas i genetiska undersökningar för att finna SNP vid komplexa sjukdomar; samma sjukdomar kan vara associerade med SNP i olika gener. Detta innebär att komplexa sjukdomar beror inte bara på obalans mellan ett stort antal gener, utan även på att dessa gener också kan skilja sig mellan olika individer. Till denna komplexitet kommer skillnader i ålder, kön och miljö. Det stora antalet sjukdomsassocierade gener och individuella variationer har stor betydelse för bla läkemedelsindustrin; trots enorma satsningar på att finna nya, mer specifika mediciner, har andelen godkända preparat minskat [4]. Detta har lett till ökat intresse från industrin att finna nya paradigm för utveckling av nya mediciner.


En introduktion till systembiologi
Förra århundradets stora landvinningar inom forskningen, inte bara medicinsk forskning utan även annan, gav detaljerade kunskaper om enskilda komponenter i komplexa system. Detta ledde i sin tur till ökat intresse för hur kunskaperna skulle kunna integreras för att ge övergripande förståelse.
I ett temanummer i Science 1999 diskuterades om det fanns gemensamma principer för att studera komplexa system oavsett om det gällde molekyler i celler, individer i sociala grupper, flora och fauna i ekosystem eller datorer på Internet [5]. Fyra år senare kom ett nytt temanummer som föreslog att komplexa system effektivt kunde analyseras genom att arrangera de enskilda komponenterna i nätverk [6]. I en social grupp beskrivs tex enskilda individer som noder i nätverket och deras interaktioner som linjer mellan noderna. Samma princip kan appliceras på ett geninteraktionsnätverk.
Anekdotiskt kan nämnas att en av de mest framträdande nätverksforskarna, Albert Barabasi, under sin post doc-tid under 1990-talet under en vandring i New York funderade på det enorma nätverk av vattenledningar som gick under gatorna och hur det kunde beskrivas matematiskt. Det fanns redan matematiska kunskaper om nätverk som Barabasi applicerade på vitt skilda typer av system. Han fann att de hade gemensamma egenskaper; de karakteriserades av att de flesta noderna interagerade med endast ett fåtal andra, däremot fanns det ett litet antal noder som hade ett mycket stort antal interaktioner och som fungerade som knutpunkter.
Ett vardagligt exempel är en skolklass, där det ofta finns en elev med många kamrater, till skillnad från flertalet elever som har enstaka kamrater. Internet är ett annat exempel; det domineras av enskilda persondatorer som länkas ihop av ett mindre antal servrar.
Barabasi spekulerade i att de få knutpunkterna hade stor betydelse för nätverken, till skillnad från det stora antalet noder med ett fåtal interaktioner [7]. Denna princip kunde senare visas i studier av proteinnätverk i jästceller; deletion av »knutpunktsproteiner« gav högre risk för celldöd än deletion av andra proteiner.
I en ny jästcellsstudie gjordes parvisa deletioner av gener. Man fann då att deletion av gener vars produkter interagerade i samma fysiologiska processer gav högre letalitet än deletion av gener vars proteinprodukter inte interagerade. Författarna spekulerade i att komplexa sjukdomar beror på SNP i gener som interagerar i samma signalväg. Detta har ännu inte kunnat visas vid komplexa sjukdomar. Dock finns exempel på bigena sjukdomar, tex retinitis pigmentosa. Denna sjukdom beror på mutationer i två interagerande gener, som var för sig inte ger sjukdom. Analogt kanske komplexa sjukdomar kan förklaras av olyckliga kombinationer av SNP i flera olika gener. Detta stöddes av en studie av sicklecellanemi, där en kombination av SNP i flera olika interagerande gener kunde användas för att predicera stroke.
De ovan nämnda studierna är diskuterade i en aktuell översiktsartikel [8] och belyser värdet av att använda jästceller för att förstå grundläggande systembiologiska principer.
En annan iakttagelse var att gener som samverkar för samma funktion, tex cellproliferation, bildar moduler inom nätverken. Detta har fått stor betydelse för studier av komplexa sjukdomar och diskuteras vidare nedan. Jästceller är lämpliga som modell, eftersom de är lätta att odla och manipulera genetiskt. Detta har lett till att jästcellerna har det mest välkarakteriserade genomet, transkriptomet, proteomet, metabolomet och interaktomet av alla organismer.
All denna information finns fritt tillgänglig via Internet. Jästcellsforskning omfattar mer än 1000 laboratorier och stora läkemedelsföretag som Astra, Lilly och Novo Nordisk. Kliniskt relevanta frågeställningar är att kunna förutsäga läkemedelsinteraktioner och biverkningar, skräddarsy medicinering och identifiera nya mediciner [9].


Nätverksbaserade analyser för att förstå komplex sjukdom
Jästcellsforskningen visade att gener som samverkar bildade moduler med specifika funktioner inom nätverken. Om detta skulle kunna överföras till mänsklig sjukdom, skulle man kanske kunna underlätta förståelsen av sjukdomsmekanismer genom att ändra skalan från ett stort antal enskilda gener till ett färre antal moduler. I en metaanalys av 3000 mikromatrisexperiment visades att det fanns sådana moduler vid cancersjukdom. Dessa kodade för olika funktioner, tex cellproliferation eller aminosyrasyntes, vilka kunde antas ha patogenetisk betydelse [10]. Liknande studier av allergisk sjukdom visade också att flera olika moduler var inblandade. Man fann att det gick att stegvis dissekera sig ner från moduler och signalvägar till enskilda gener för att bilda hypoteser om grundläggande sjukdomsmekanismer (Figur 1) [11].
Dessa hypoteser kunde senare undersökas i kliniska, experimentella eller genetiska studier.
Nätverksbaserade analyser skulle också kunna användas som utgångspunkt för att studera individuella variationer, tex hur SNP i olika genkombinationer påverkar sjukdomsassocierade moduler.


Storskaliga studier av mänskliga gener och genuttryck
HUGO-projektet ledde till utveckling av nya metoder för att effektivare studera det mänskliga genomet, transkriptomet och proteomet. Det finns bla olika tekniker för att samtidigt analysera 100000-tals SNP. En viktig teknik är DNA-mikromatris [12]. I princip bygger denna på att fästa korta DNA-sekvenser motsvarande kända gener på en glasplatta. Dessa kan sedan hybridisera till det okända DNA eller mRNA som ska analyseras. DNA-sekvenser motsvarande hela människans genom kan fästas på en centimeterstor platta (Figur 2).
Om syftet är att tex identifiera sjukdomsassocierade mRNA-moduler används mRNA från patienter och kontroller. Det finns även metoder för att studera alla proteiner (proteomet), byggda på masspektrometri. Inom några år kanske samtidig applikation av flera analysmetoder kan leda till identifiering av sjukdomsmoduler som omfattar information om mRNA och proteinförändringar och om underliggande genetiska variationer som orsakar kvantitativa och kvalitativa förändringar i genuttryck. Liknande, flerdimensionella moduler, som även innefattar kinetisk information, har beskrivits av jästcellsforskare [13].


Systembiologiska studier av sjukdomar in vivo
Den kanske mest närliggande systembiologiska kliniska applikationen är individualiserad medicinering. I en artikel i Nature Biotechnology i maj 2007 beskrevs att amerikanska regeringen förbereder en strategisk satsning inom detta område. Dessutom gavs konkreta exempel där utveckling av nya mediciner vid inflammatoriska och psykiatriska sjukdomar kopplats till identifiering av biomarkörer för att individanpassa dessa mediciner [14].
DNA-mikromatristeknik har använts för att finna genexpressionssignaturer som kan användas för att individualisera medicinering. Vid bröstcancer har detta lett till ett kommersiellt kliniskt test som bygger på mätning av mRNA-uttryck för 70 gener. Sådana test har dock lett till diskussioner om metodens tillförlighet och huruvida det finns tillräcklig kunskap bland läkare för att rätt tolka resultaten. Kanske kan denna typ av analys få praktisk klinisk betydelse om man kan välja ut ett fåtal markörer som lätt kan mätas med rutinmetoder.
Ett problem med dessa genexpressionssignaturer är att de inte innehåller någon information om sjukdomsmekanismer. I detta sammanhang är den tidigare nämnda metaanalysen av 3000 mikromatrisexperiment utförda på cancermaterial intressant, eftersom författarna fann moduler av funktionellt relaterade gener som tydde på att vissa cellulära funktioner var generellt involverade vid cancer. Sådana moduler skulle kunna dissekeras vidare för att identifiera diagnostiska markörer eller kanske terapeutiska molekyler [10, 11].
Ett annat problem vid studier av komplexa sjukdomar, som stroke eller diabetes, är att identifiera en relevant cell eller vävnad som är tillgänglig för kliniska studier. Allergisk rinit är ett exempel på en komplex sjukdom där sådana material är relativt lättillgängliga. Det går att studera tex CD4-positiva celler som allergenprovocerats in vitro eller hudbiopsier efter lokal allergenprovokation.
En annan viktig del i studier av komplexa sjukdomar är att finna tillräckligt stora och välkarakteriserade material. Detta belyses av en aktuell studie av Laitinien och medarbetare som syftade till att identifiera astmaassocierade gener. De kunde identifiera och experimentellt validera en gen, GPRA, först efter att ha undersökt tre olika kohorter från Finland och Kanada [15]. I en annan studie av typ2-diabetes kunde fem olika gener identifieras efter att nästan 400000 SNP hos 700 patienter och 600 kontroller hade undersökts. Resultaten verifierades i ett nytt material bestående av 5500 individer [16].


Integromik för systembiologiska sjukdomsstudier in silico
De ovan nämnda studierna belyser de stora resurser som krävs för att identifiera sjukdomsassocierade gener vid komplexa sjukdomar. Dels behövs tvärdisciplinär kompetens som inkluderar olika kliniska specialister, genetiker, statistiker, bioinformatiker, dataloger och avbildningsexperter, dels experimentella discipliner för funktionella studier. Dessutom blir det allt viktigare att integrera de egna kliniska och experimentella studierna med systematiska studier av medicinsk information i olika databaser.
Detta håller på att utvecklas till ett eget specialområde, integromik.
Som bakgrund kan nämnas att det finns enorma mängder medicinska data i olika databaser, som ofta är fritt tillgängliga via Internet. Det mest välkända exemplet är National Center for Biotechnology Information, http://www.ncbi.nlm.nih.gov. Denna innehåller förutom Medline sammanställningar om olika sjukdomar och geners funktioner samt molekylära databaser med detaljerad sekvensinformation.
Dessutom finns olika bioinformatiska verktyg och resultaten från 1000-tals DNA-mikromatrisexperiment fritt tillgängliga. Detta är resultatet av att flera tidskrifter kräver att forskare i samband med publicering även publicerar mikromatrisdata. Även om de inte är lätta att använda för forskare med huvudsakligen biologisk bakgrund, har offentliga mikromatrisdata redan använts i flera studier, bla i den tidigare beskrivna metaanalysen av 3000 mikromatrisexperiment från tumörer [10].
Inom de närmaste åren planeras storskaliga genetiska undersökningar av olika komplexa sjukdomar. Det finns ett ökande intresse för att även göra resultaten från sådana undersökningar tillgängliga för forskarsamhället via Internet. Resultaten tros snart överstiga exabyte-nivå (1018 byte). Storleksordningen kan anas av en jämförelse med mänskligt språk; den motsvarar antalet ord som någonsin yttrats av människor [17].
Dessutom finns olika databaser med kompletterande information på genom- och proteomnivå. I Sverige har tex Mattias Uhlén (Kungliga Tekniska högskolan, Stockholm) och medarbetare publicerat the Human Protein Atlas, http://www. proteinatlas.org, som visar uttryck och lokalisering av proteiner i ett stort antal friska vävnader och i cancerceller. En viktig aspekt är att man kan utnyttja att DNA-, mRNA- och proteinnivåerna är funktionellt sammanlänkade; tex styrs mRNA-uttryck av regulatoriska områden intill de olika genernas kodande områden. SNP i regulatoriska områden kan därigenom påverka hur mycket mRNA som produceras. Det innebär att genexpressionsdata kan användas för att leta sådana SNP, vilket kan vara en fördel jämfört med oselekterade analyser av 100000-tals SNP.
I en studie av 100-tals DNA-mikromatrisexperiment utförda på inavlade möss kunde man visa tex hur mRNA-uttryck skilde sig mellan olika musstammar och att detta kunde länkas till förändringar på DNA-nivå [18]. Samma metoder användes för att finna SNP i en metaanalys av mikromatrisstudier av allergisk sjukdom. Dessa var mycket minneskrävande och utfördes med hjälp av en superdator vid Oak Ridge National Laboratory (Figur 3).
Sådana studier visar hur det traditionella invitro-arbetet alltmer kompletteras av insilico-analyser (i dator). Databearbetning kan också användas för praktiska kliniska applikationer, som att väga ihop flera olika diagnostiska markörer för att klassificera patienter (Figur 4) [19].
Detta har en viktig principiell betydelse. Komplexa sjukdomar beror på ändrade interaktioner mellan olika gener, snarare än på absoluta förändringar i enskilda gener. Därför behövs multivariata algoritmer som beskriver hur kombinationer av olika markörer relaterar till sjukdom.


Systembiologisk forskning i internationellt perspektiv
Stora systembiologiska centra har startats i USA och Asien. I Europa finns inga enskilda centra som samlat all den tvärvetenskapliga kompetens som behövs för systembiologisk forskning på samma ort. I stället försöker man knyta ihop flera olika universitet. Den största nationella satsningen har gjorts i Schweiz, där 200 miljoner schweizerfranc investerats med stöd av bla läkemedelsindustrin. Liknande satsningar har gjorts i Danmark, Storbritannien, Tyskland och Holland. En aktuell engelsk utredning av ledande akademiska och industriella företrädare föreslog att motsvarande 1 miljard svenska kronor skulle investeras i klinisk systembiologi i Storbritannien.
EU stöder sedan några år systembiologiska projekt, tex studier av modellorganismer eller biosimuleringsprojektet BioSim, som syftar till att underlätta läkemedelsutveckling. Flera av dem leds från Sverige, bla ComplexDis, som syftar till identifiering av markörer för individualiserad medicinering med allergisk rinit som modellsjukdom, se http://www.complexdis.org.gu.se.
Under 2007 stöder EU även projekt som syftar till storskalig kartläggning av genetiska variationer i Europa och samling av sådan information i gemensamma databaser. Här har Sverige en fördel genom att vi har flera stora patientregister, tex tvillingregistret. Flera stora läkemedelsföretag, bla AstraZeneca, prioriterar systembiologisk forskning för att effektivisera utveckling av nya läkemedel. Inom svenska universitet finns ett antal systembiologiska enheter, varav en klinisk, men ingen strategisk satsning som omfattar de medicinska, tekniska och naturvetenskapliga fakulteterna inom ett eller flera universitet.
Från svensk synpunkt är det intressant att 2008 års internationella konferens i systembiologi kommer att hållas i Göteborg; år 2006 hölls den i Stockholm.


Etiska frågeställningar
En alltmer detaljerad kartläggning av hur individers genetiska variationer förhåller sig till sjukdom innebär ökad risk för integritetskränkning. Detta är ett problem som ställer stora krav på tidig och öppen diskussion mellan patientorganisationer, sjukvårdsföreträdare och myndigheter. Om ett fåtal protein- eller genmarkörer kan identifieras som ersättning för genomomfattande expressionsstudier, kanske man kan utnyttja teknikens fördelar utan att patientens genom kartläggs ingående.


Framtidsperspektiv
Om det går att lösa de många tekniska och teoretiska problemen med att identifiera sjukdomsassocierade moduler vid komplexa sjukdomar, skulle dessa kunna bidra till en mer ingående förståelse av sjukdomsmekanismer och hur de varierar mellan olika individer. Denna information skulle också kunna användas för kliniska syften, tex att identifiera markörer för att individualisera medicinering. Den redan omtalade strategiska satsningen från amerikanska regeringen kan bidra till detta [14]. Sådan diagnostik kräver samtidig mätning av flera olika proteiner eller metaboliter, vilket i sin tur förutsätter nya tekniker som är snabba, enkla, billiga och säkra. Nanoteknologiska metoder för högkänslig mätning av gener, mRNA och proteiner är under utveckling.
Hood och medarbetare har i Science framfört att detta kan leda till att det kommer att bli möjligt att mäta 5–10 biomarkörer från enskilda celler eller mycket små vätskevolymer redan inom de närmaste åren [20]. Sådana tekniker kanske kan utformas i miniatyrformat till låg kostnad och därmed kunna användas i klinisk rutinsjukvård utan krav på komplicerad kringapparatur. Kanske kommer detta leda till att läkare inom exempelvis öppenvården rutinmässigt analyserar biomarkörer i blod eller saliv för att tex individualisera behandling.
Samma principer kanske kan appliceras för att finna biomarkörer för att förutsäga biverkningar. Detta kan förutom minskat lidande vara av intresse för läkemedelsindustrin; om biverkningar kan förutsägas kanske det går att åter använda preparat som dragits in på grund av biverkningar hos ett litet antal patienter.
Hood och medarbetare framförde en annan möjlig applikation av klinisk systembiologi [20]. Dagens sjukvård är i huvudsak reaktiv, dvs den fokuserar på att behandla redan etablerade sjukdomar, inte sällan sent i förloppet. Mer detaljerad och känslig diagnostik kan medföra att sjukvården inom de närmaste decennierna (10–20 år) kommer att få en mer förutsägande och preventiv roll. Detta gäller inte bara mätningar av multipla biomarkörer som del av den kliniska undersökningen, utan kanske även sekvensering av relevanta delar av genomet hos enskilda patienter. Klinisk systembiologi kan bidra genom att på ett tolkningsbart sätt integrera sådan information. Sådan detaljerad information kanske kan användas till att säkrare förutsäga sjukdom innan den bryter ut eller till att ställa diagnos tidigare. Detta kan medföra effektivare behandling: från preventiv intervention till reversering eller blockering av sjukdomsmekanismer.
Detta förutspås få en genomgripande betydelse för hur sjukvård bedrivs och för forskning och utbildning inom de närmsta två decennierna. Det är därför angeläget att svenska kliniker, forskare och beslutsfattare snarast tar ställning till hur klinisk systembiologisk forskning ska bedrivas i Sverige.

Potentiella bindningar eller jävsförhållanden: Inga uppgivna.



Figur 1. Nätverksbaserad analys av DNA-mikromatisdata. a) Sjukdomsassocierade gener (röda) infogas i en modell av det mänskliga geninteraktionsnätverket (gråa gener). b) Moduler av sjukdomsassocierade gener med relaterad funktion identifieras. c) Sådana moduler dissekeras för att identifiera signalvägar. d) En sådan signalväg analyseras i detalj, tex för att finna en uppströmsgen som kan ha en nyckelfunktion för signalvägen. En sådan gen kan undersökas med genetiska och experimentella analyser. Slutligen kan motsvarande protein testas som diagnostisk markör.




Figur 2. Ett DNA-mikromatrischip. DNA-sekvenser motsvarande 40000 gener och genvarianter är fästa på glasplattan mitt i chippet och används för att mäta motsvarande mRNA-uttryck i det prov som ska analyseras.




Figur 3. SGI Altix superdator vid Oak Ridge National Laboratory, USA.




Figur 4. Diagnostisk klassificering av två patientgrupper med en matematisk algoritm, vilken analyserar mRNA-uttryck för tre gener från en DNA-mikromatrisstudie [19].