Tiedemaailma juhlii 28. helmikuuta 2003 hyvin erityistä vuosipäivää. Tänä päivänä viisikymmentä vuotta sitten James Watson ja Francis Crick löysivät DNA:n rakenteen – itse elämän ytimen. Siitä lähtien DNA:n tutkimus on antanut biologeille suuren ymmärryksen elämästä ja mahdollistanut myös lukemattomien hyödyllisten työkalujen luomisen, joilla on laaja-alaisia sovelluksia sekä tieteelle että yhteiskunnalle. Kuitenkin vasta 1990-luvun alussa tutkijat alkoivat tutkia mahdollisuutta hyödyntää DNA:n kykyä tallentaa ja käsitellä tietoa biologian ulkopuolella. Vuonna 1994 yhdysvaltalainen proof-of-principle -tutkimus osoitti, että DNA:ta voidaan käyttää matemaattisten ongelmien ratkaisemiseen, mikä herätti huomattavaa kiinnostusta tutkijoiden keskuudessa, jotka toivoivat DNA:n jonain päivänä korvaavan piin uuden tietokoneaallon perustana. Alkuinnostus on kuitenkin sittemmin laantunut, kun tutkijat ovat ymmärtäneet, että DNA-laskentaan liittyy lukuisia ongelmia ja että heidän olisi elettävä piipohjaisten tietokoneidensa kanssa vielä jonkin aikaa. Tämän vuoksi ala on muuttanut painopistettään, ja nyt DNA-laskennan tutkimus keskittyy pääasiassa ”sellaisten soluissa tapahtuvien prosessien tutkimiseen, joita voidaan pitää loogisina laskutoimituksina, ja sitten näiden laskutoimitusten käyttämiseen hyödyksemme”, kuten Martyn Amos brittiläisestä Exeterin yliopistosta kuvailee.
1 018 DNA-säikeestä koostuva sekoitus voisi toimia 10 000 kertaa nopeammin kuin nykyiset kehittyneet supertietokoneet
Ensimmäisen DNA:han perustuvan tietokoneen rakentamisen uranuurtajaksi nousi Etelä-Kalifornian yliopiston (USA) tietojenkäsittelytieteen ja molekyylibiologian professori Leonard Adleman (L. M. Adleman, tiedejulkaisu tieteellisessä aikakauskirjassa Science 266, 1021-102; 1994 ). Häntä kiehtoi molekyylin valtava kyky tallentaa tietoa hyvin pieneen tilaan, ja hän ryhtyi ratkaisemaan klassista matemaattista pulmaa, niin sanottua Hamiltonin polkuongelmaa, joka tunnetaan paremmin nimellä Travelling Salesman -ongelma. Tämä näennäisen yksinkertainen pulma – myyntimiehen on käytävä useissa kaupungeissa, jotka on yhdistetty toisiinsa rajallisilla teillä kulkematta minkään kaupungin läpi useammin kuin kerran – on itse asiassa melkoinen tappaja, ja jopa kehittyneimmiltä supertietokoneilta kestäisi vuosia laskea optimaalinen reitti 50 kaupunkiin. Adleman ratkaisi ongelman seitsemän kaupungin osalta sekunnissa käyttämällä tavallisessa reaktioputkessa olevia DNA-molekyylejä. Hän esitti jokaisen näistä seitsemästä kaupungista erillisinä, yksisäikeisinä DNA-molekyyleinä, joiden pituus oli 20 nukleotidia, ja kaikki mahdolliset reitit kaupunkien välillä DNA-molekyyleinä, jotka koostuivat lähtökaupungin kymmenestä viimeisestä nukleotidista ja tulokaupungin kymmenestä ensimmäisestä nukleotidista. DNA-säikeiden sekoittaminen DNA-ligaasin ja adenosiinitrifosfaatin (ATP) avulla johti kaikkien mahdollisten satunnaisten polkujen luomiseen kaupunkien läpi. Suurin osa näistä poluista ei kuitenkaan soveltunut tilanteeseen – ne olivat joko liian pitkiä tai liian lyhyitä tai ne eivät alkaneet tai päättyneet oikeaan kaupunkiin. Tämän jälkeen Adleman suodatti pois kaikki polut, jotka eivät alkaneet eivätkä päättyneet oikeaan molekyyliin, ja ne, joiden pituus ja koostumus ei ollut oikea. Kaikki jäljelle jääneet DNA-molekyylit edustivat ratkaisua ongelmaan.
Tällaisten pikkuruisten molekyylien sisältämä teho aiheutti innostusta tietojenkäsittelymaailmassa
Adlemanin kokeen laskenta puuskutteli 1 014 operaation sekuntinopeudella, mikä on 100 teraflopsia eli 100 triljoonaa liukulukutoimitusta sekunnissa; maailman nopein supertietokoneen, japanilaisen NEC Corporationin omistaman Earth Simulatorin, nopeus on vain 35,8 teraflopsia. On selvää, että DNA:n avulla tapahtuvalla laskennalla on valtavia etuja piipohjaisiin koneisiin verrattuna. Nykyinen teknologia perustuu hyvin lineaariseen logiikkaperiaatteeseen, ja yksi laskutoimitus on suoritettava loppuun ennen kuin seuraava voidaan aloittaa, kun taas DNA:n käyttö tarkoittaa, että valtava määrä laskutoimituksia voidaan suorittaa samanaikaisesti. Tämä rinnakkainen teho on moninkertaisesti nopeampi kuin perinteisillä koneilla – 1 018 DNA-säikeen yhdistelmä voisi toimia 10 000 kertaa nopeammin kuin nykyiset kehittyneet supertietokoneet. Toinen merkittävä etu on tiedon tallennusmahdollisuudet. Perinteiset tallennusvälineet, kuten videonauhat, vaativat 1012 kuution nanometriä tilaa yhden tietobitin tallentamiseen, kun taas DNA-molekyylit vaativat vain yhden kuution nanometrin bittiä kohti. Ei ole yllättävää, että näiden pikkuruisten molekyylien sisältämä teho herätti innostusta tietojenkäsittelymaailmassa, ja monet toivoivat, että ”DNA-tietokoneet voisivat ohittaa piipohjaisen tekniikan”, kommentoi Ron Weiss, sähkötekniikan professori Princetonin yliopistossa, New Jerseyssä, USA:ssa Kuvio 1.
Leonard Adlemanin DNA-tietokoneen periaate ”Matkustavan myyntimiehen” ongelman ratkaisemisessa.
Tämä oli kuitenkin kahdeksan vuotta sitten, ja vaikka DNA-tietokoneen potentiaali näytti valtavan suurelta, välivaiheen tutkimukset ovat osoittaneet, että sen käytössä on suuria rajoituksia. Ongelman kaikkien mahdollisten ratkaisujen esittäminen DNA-säikeinä tarkoittaa, että laskenta saadaan nopeasti valmiiksi, mutta Amos sanoi: ”Sinun on suoritettava tyhjentävä haku löytääksesi pienen neulan suuresta heinäsuovasta”, ja se vaatii eksponentiaalisia resursseja muistin suhteen. Vaikka DNA:han voidaan tallentaa triljoona kertaa enemmän tietoa kuin nykyisiin tallennusvälineisiin, tapa, jolla tietoa käsitellään, vaatii valtavan määrän DNA:ta, jos halutaan ratkaista suurempia ongelmia. ”On arvioitu, että jos Hamiltonin polkuongelma skaalattaisiin Adlemanin seitsemästä kaupungista 200 kaupunkiin, kaikkien mahdollisten ratkaisujen esittämiseen tarvittavan DNA:n paino ylittäisi maapallon painon”, Amos sanoo. Lisäksi, vaikka laskentaprosessi tapahtuu huikealla nopeudella, tuloksen ”tulostaminen” on tuskastuttavan hidasta ja sisältää monia vaiheita – Adlemanilla kesti viikon laboratoriotyöt poimia mahdolliset ratkaisut DNA-cocktailistaan.
Yleinen yksimielisyys on nyt, että DNA-laskenta ei koskaan pysty kilpailemaan suoraan piipohjaisen tekniikan kanssa
Menetelmän tarkkuuteen liittyy myös ongelmia. DNA:n säikeiden synteesissä voi tapahtua virheitä, kuten vääränlaisia pareja, ja se on hyvin riippuvainen siihen osallistuvien entsyymien tarkkuudesta. Vaikka tämä ei vaikuttanutkaan Adlemanin työhön, hän käsitteli vain alle 100 mahdollisuutta; täysin toimiva tietokone joutuisi suorittamaan tuhansia ja taas tuhansia laskutoimituksia, mikä tarkoittaa, että virheiden mahdollisuus kasvaa eksponentiaalisesti. Lisäksi kun monimutkaisempiin toimenpiteisiin tarvitaan monimutkaisempia molekyylejä, molekyylien koko kasvaa, samoin kuin niiden leikkautumistodennäköisyys, mikä taas lisää virheitä Kuva 2.
Ehud Shapiron molekulaarinen Turingin kone.
Weiss ei ole luottavainen näiden teknisten ongelmien voittamisen suhteen, ja tätä mieltä ovat muutkin alan tutkijat. Yleinen konsensus on nyt, että näiden rajoitusten vuoksi DNA-laskenta ei koskaan pysty kilpailemaan suoraan piipohjaisen teknologian kanssa. Tämä ei kuitenkaan tarkoita, että DNA-laskenta olisi mennyttä – kaukana siitä. Ongelmat ovat kuitenkin pakottaneet miettimään asioita uudelleen, ja Amosin mukaan ”painopiste on nyt siirtynyt pois alkuperäisestä tavoitteesta”. Hän uskoo, että DNA-laskennassa on edelleen paljon potentiaalia, mutta hänen mielestään ”DNA-laskennan rikkaimmat mahdollisuudet piilevät in vivo -laskennassa” eli teknologian käyttämisessä pienemmässä mittakaavassa, solujen sisällä. Weissille realistinen tavoite on ”demonstroida hallintaa molekyylitasolla.”
Ensimmäisen demonstraation tästä tavoitteesta sai kaksi vuotta sitten aikaan Ehud Shapiron ryhmä israelilaisessa Weizmann-instituutissa (Y. Benenson et al. . Nature 414, 430-434; 2001 ), joka rakensi biomolekyyleistä ohjelmoitavan ja itsenäisen laskentakoneen. Tämä ”automaatti” muistuttaa brittiläisen matemaatikon Alan Turingin (1912-54) vuonna 1936 kehittämää hypoteettista Turingin konetta, joka on laite, joka muuntaa tiedon yhdestä muodosta toiseen ja toimii rajallisella symbolisarjalla – Shapiron kone käytti kahta ”syötettä”. Siirtymäsääntöjen perusteella kone muuttaa sisäistä tilaansa senhetkisen tilan ja syötteen mukaan, kunnes se saavuttaa ”lopputilan”, kun kaikki syötteet on käsitelty. Shapiron automaatti käyttää restriktioendonukleaaseja ja ligaasia ”laitteistona” koneen tilan muuttamiseksi ja kaksisäikeistä DNA:ta syötteinä ja siirtymäsääntöinä. Entsyymit ligatoivat ja leikkaavat DNA:n ”ohjelmistoa” jatkuvasti, kunnes se saavuttaa lopullisen tilan – määritellyn tahmean pään – johon ”reportteri”-DNA ligatoidaan, jolloin laskenta päättyy. Shapiro toivoo voivansa kehittää tätä hyvin yksinkertaista konseptia ja rakentaa asteittain monimutkaisempia malleja, kunnes hän pystyy rakentamaan täysin toimivan molekulaarisen Turingin koneen. Tämä olisi melkoinen saavutus, sillä Turingin kone pystyy suorittamaan kaikki matemaattiset operaatiot, ja sitä pidetään nykyisten tietokoneiden perustana. Hänen on vaikea ennustaa, pystyykö hän saavuttamaan tavoitteensa, mutta ”suunta on lupaava”, hän lisäsi.
Kuten Shapiro sanoi, ”paljon tietoa on saatavilla biologisina molekyyleinä. Jos niitä pystyy ohjelmoimaan ja reagoimaan informaatioon, voi tehdä paljon.” Hänen pitkän aikavälin visionsa on ”luoda molekulaarisia laskentakoneita, jotka voivat analysoida tilanteita soluissa ja sitten syntetisoida molekyylejä käsittelemään niitä.” Tällaisen teknologian sovellusmahdollisuudet ovat laajat. Ohjelmoitujen solujen käyttämisellä ”biologisina vartijoina”, kuten Weiss niitä kutsui, voisi olla ilmeisiä sovelluksia sairauksien torjunnassa, sillä ne tunnistaisivat vaurioituneet solut tai kudokset ja joko ilmoittaisivat ongelmasta tai, mikä vielä parempaa, saisivat aikaan parantavien molekyylien vapautumisen.
Toinen lupaava suunta on DNA:n molekulaarinen itsekokoonpano monimutkaisten molekyylirakenteiden rakentamiseksi, millä voi olla vaikutusta muilla aloilla, kuten nanoteknologiassa. Eric Winfree Kalifornian teknologiainstituutista, Yhdysvalloista, on omistanut paljon aikaa tälle aiheelle ja kehittänyt menetelmän, jolla voidaan rakentaa molekyylisiä ”laattoja” – DNA:n pieniä palikoita. Ohjelmoimalla näiden laattojen reunoja hän on pystynyt pakottamaan DNA:n liittymään yhteen pieniksi molekyylikuvioiksi. Toistaiseksi hän on kuitenkin pystynyt rakentamaan vain yksinkertaisia rakenteita, ja hänen mukaansa ”meidän on päästävä pisteeseen, jossa voimme rakentaa monimutkaisia kuvioita.”
Mutta, kuten Amos huomautti, ”tällä hetkellä tämä on vain sinistä taivasta”. Kaikki tämä tutkimus on vielä periaatteen osoittamisvaiheessa, ja kaikki käytännön sovellukset ovat vähintään viiden tai kymmenen vuoden päässä. On selvää, että DNA-laskenta ei tule kilpailemaan nykyisten piipohjaisten koneiden kanssa, eikä se tule vaikuttamaan siihen, miten sinä tai minä elämme”, Weiss sanoi. Alan todellinen jännitys piilee kuitenkin siinä, että biologit, kemistit, tietojenkäsittelytieteilijät ja matemaatikot yhdistävät voimansa ymmärtääkseen ja simuloidakseen solujen sisällä tapahtuvia biologisia perusprosesseja ja algoritmeja. ”Meidän ei pitäisi pyrkiä kilpailemaan perinteisten koneiden kanssa, vaan meidän pitäisi etsiä laatikon ulkopuolelta markkinarakoa muille sovelluksille”, Amos sanoi. Hän kuitenkin lisäsi: ”Jos olen rehellinen, bioinformatiikka ei ole vielä vakiinnuttanut tätä markkinarakoa.”