Skräp-DNA är benämningen på arvsmassa som inte har någon känd funktion. Nu visar ett omfattande forskningsprojekt att en betydligt mind­re del av vårt genom utgörs av skräp än vad man tidigare trott.
Projektet går under namnet Encode, en förkortning för Encyclopedia of DNA Elements. Det kan ses som en uppföljning till det omfattande Hugo-projektet som färdigställdes kring millennieskiftet och som omfattade kartläggning av samtliga tre miljarder baspar i den mänskliga arvsmassan. Det visade sig i Hugo-projektet att människan bara har ca 20 000 gener, färre än vad man trott. Förbryllande nog var det bara ett par procent av arvsmassan som ingick i dessa 20 000 gener. Resten, upp mot 98 procent, kallades »skräp-DNA« (junk-DNA) då det antogs vara verkningslöst. Resultatet förvånade många. Varför skulle vi bära runt på stora mängder meningslöst DNA, som vid varje enskild celldelning måste kopieras med den energi detta kräver? »Biologins mörka materia«, som det kom att kallas, blev en omdebatterad gåta.

Encode-projektet påbörjades 2003 med syftet att analysera vad den del av arvsmassan som inte ingår i gener har för funktion. Totalt har 442 forskare vid 32 centra, majoriteten av dem i USA och Storbritannien, ingått i satsningen, som främst finansierats av amerikanska National Institutes of Health. Med hjälp av flera olika genteknologiska metoder har forskarna analyserat om arvsmassan har någon biologisk funktion i 147 olika former av mänsklig vävnad, exempelvis myocyter, hepatocyter, neuron och endotelceller men också stamceller från embryon och cancerceller. Med hjälp av mycket omfattande datakraft – hundratals terabyte rådata har byggts upp – har aktiviteten i bit för bit av arvsmassan analyserats i respektive vävnadsform. Resultatet av hela projektet presenteras nu i ett flertal vetenskapliga och medicinska tidskrifter, bl a Nature.

Sammantaget visar forskarna att ca 80 procent av vår arvsmassa har en funktion i minst en biokemisk process i minst en typ av vävnad. De innebär i korthet att majoriteten av vår arvsmassa är biologiskt aktiv inom något område och inte verkningslös. Författarna tror att de delar av genomet som inte innehåller gener orsakar mer variabilitet än generna själva. De förundras över komplexiteten i genomet, som tycks vara mer kaotiskt och mindre strukturerat än vad man tidigare trott. En av författarna uttrycker det i en kommentar »som om vår arvsmassa vibrerar av liv«. Man har t ex funnit ett stort antal hittills okända transkriptionsfaktorer, som var och en kan reglera uttrycket av tusentals olika gener. Därtill har hundratusentals s k enhancers identifierats, områden som kan förstärka eller dämpa genernas uttryck. Det intressanta är att dessa enhancers kan påverka gener som befinner sig mycket långt ifrån dem i arvsmassan. Förmodligen spelar de en viktig roll för varför helt olika proteiner uttrycks i olika celltyper.

All information från Encode-projektet har samtalts i en databas som är öppen, dvs som fritt kan användas för andra forskare. Encode-forskarna beskriver databasen som en «mänsklig encyklopedi«. Men precis som med Hugo-projektet ska Encode sannolikt främst ses som en viktig del av början på kartläggningen av vår arvsmassa, inte som en komplett rapport som ger slutgiltiga svar. Under kommande decennier kommer kunskap att byggas upp kring hur genomet kan kopplas till olika sjukdomsprocesser. Det kan i sin tur ge vägledning om varför behandlingssvaret på ett och samma läkemedel kan skilja sig mellan olika människor. I förlängningen kan detta innebära möjligheter att skräddarsy behandlingen utifrån en individs unika genetiska egenskaper.
Ett stort antal studier av hela genomet hos patienter med olika sjukdomar (s k genomassociationsstudier, GWAS) har under senare år identifierat områden i arvsmassan som kan kopplas till olika sjukdomar. De flesta av dessa områden har legat utanför generna, och det har varit svårt att svara på varför en mutation i ett givet, till synes verkningslöst, område påverkar risken för en viss sjukdom. Förhoppningsvis finns det bättre förutsättningar för att svara på dessa frågor nu och därigenom att öka förståelsen kring de biologiska processerna bakom en mängd olika sjukdomar.