Eerste DNA-computer was (bijna) de laatste

Reading time: 10 minutes

Author:

Het probleem dat aan een DNA-computer werd gevoerd, was triviaal. De meeste mensen hebben aan een minuut genoeg om de oplossing te vinden, een pc doet het veel sneller. Ook de moleculaire rekenmachine heeft minder dan een seconde nodig, maar daarna kost het nog veel tijd en moeite om de uitkomst te scheiden van alle niet-oplossingen die onvermijdelijk ook worden gegenereerd. En dat bleek niet eens de enige tekortkoming.

DNA gebruiken om mee te rekenen, op papier heeft het beslist potentie. Als informatiedrager heeft het biopolymeer na miljoenen jaren de blauwdruk van het leven bewaard te hebben, zijn sporen wel verdiend. Het bevat een theoretische informatiedichtheid van ongeveer honderd terabit per vierkante inch, terwijl een dvd niet verder komt dan 2,2 gigabit per vierkante inch, een moderne harddisk het moet doen met 250 gigabit per vierkante inch en de meest geavanceerde opslagsystemen in ontwikkeling worstelen om de grens van een terabit per vierkante inch te doorbreken.

Behalve de opslagcapaciteit mag ook het potentieel om informatie te verwerken er wezen. Met DNA kunnen op ongekende schaal parallelle berekeningen worden uitgevoerd en eindelijk bepaalde typen problemen computationeel kunnen worden opgepakt – problemen waar zelfs de snelste supercomputers nu niet aan hoeven te beginnen. Wat dat betreft zou een DNA-computer een al evenzeer niet bestaande kwantumcomputer naar de kroon steken, terwijl hij, hoe kan het ook anders met een natuurproduct, toch buitengewoon ’groen‘ zou zijn. Een DNA-computer opereert dicht bij het theoretische maximum van 34 x 1019 (irreversibele) operaties per joule. Beter kan niet.

Op de kop af veertig jaar na de ontrafeling van de beroemde dubbele-helixstructuur in 1953 achtte een theoretisch informaticus de tijd rijp om eens iets van de vermogens van DNA af te tappen. Daarvoor zou die onderneming nog een hopeloze zaak zijn geweest: de wetenschap moest eerst nog de DNA-machinerie doorgronden en temmen. Pas in de jaren negentig had zij daar voldoende grip op gekregen om in een reageerbuis ’onnatuurlijke‘ dingen met DNA te doen aan zelf geconstrueerde, eenvoudige systemen.

De bewuste theoretisch informaticus is waarschijnlijk voor menig Bits&Chips-lezer geen onbekende: Leonard Adleman. De Amerikaan stond samen met Ron Rivest en Adi Shamir aan de wieg van het encryptiealgoritme RSA, werk dat hen in 2002 de Turing Award opleverde. Minder bekend is waarschijnlijk Adlemans interesse voor de moleculaire biologie. Zelf schrijft hij in Scientific American dat hij als buitenstaander ’opmerkelijk onsuccesvol‘ was geweest zijn ideeën over aidsonderzoek over te brengen aan de betreffende researchgemeenschap. Daarom besloot hij zichzelf maar onder te dompelen in de moderne biologie. Ruim over de helft van zijn carrière, in 1993, dook de toen bijna vijftigjarige Adleman het laboratorium in.

Het duurde niet lang voordat de kersverse onderzoeker iets opviel. DNA bestaat uit een keten van vier chemische verbindingen die worden aangeduid met de letters A, T, G en C. In een cel wordt de volgorde van deze letters uitgelezen en in een aantal stappen omgezet in eiwitten, de biologische componenten die het werk verzetten in de cel. Deze transformatie van informatie heeft opmerkelijk veel weg van de Turing-machine, de automaat die (in bepaalde gedaante) informatie inleest van tape, daar een geprogrammeerde bewerking op loslaat en de uitkomst wegschrijft op een andere tape. Van Turing-systemen wordt aangenomen dat ze alles kunnen berekenen wat maar berekenbaar is. Dat betekent dat DNA  getallen kan ontbinden in factoren, schaken, codes kraken, noem maar op!

Figuur 1. Adleman wilde met DNA berekenen welke route alle zeven steden op deze kaart slechts een keer aandoet.

Snufje

Om dit besef in de praktijk te brengen, had Adleman een probleem nodig om op te lossen. Dat was nog niet zo eenvoudig: een theoretische Turing-machine kun je alle denkbare bewerkingen laten uitvoeren, maar een fysieke niet. Daarin ben je gebonden aan wat mechanisch of elektronisch mogelijk is. Om met DNA te rekenen, ben je afhankelijk van de hulpmiddelen die de natuur heeft ontwikkeld. Die gereedschapskist is beperkt in de zin dat er uitsluitend enzymen zijn geëvolueerd om DNA-strengen uit te lezen, te kopiëren, op te knippen, aan elkaar te plakken en te repareren. Enzymen waarmee ter lering en vermaak van de mensheid schakende Turing-machines geconstrueerd kunnen worden, heeft de evolutie links laten liggen. In theorie zijn deze wel te synthetiseren, maar zover is de wetenschap nog lang niet.

Adleman kwam tot de conclusie dat hij voor het oplossen van een handelsreizigersprobleem naast enkele standaard moleculair-biologische technieken genoeg had aan drie enzymen, namelijk om DNA te knippen, te kopiëren en te plakken. Het doel was, gegeven een begin- en eindpunt, om de route langs  zeven steden (onderling verbonden volgens figuur 1) te berekenen, zonder een stad twee keer aan te doen. Zolang het aantal knooppunten maar laag genoeg is, hebben mensen weinig moeite om vast te stellen of er een oplossing is. Voor de zeven steden in figuur 1 is een minuutje wel genoeg om de enige oplossing te vinden.

Computers kunnen het sneller en hebben ook geen moeite met wat grotere vraagstukken, maar de rekentijd loopt razendsnel op naarmate het aantal steden toeneemt. Dat komt omdat er geen efficiënt algoritme bestaat om dit wereldberoemde probleem op te lossen. Jammer voor chipmakers, want hoe elektronische schakelingen onderling optimaal kunnen worden verbonden, is ook een speciaal geval van het handelsreizigersprobleem.

Om DNA de zogenaamde Hamilton-route te laten berekenen, moet iedere toegestane verbinding tussen twee steden worden gecodeerd in DNA. Adleman deed dat door iedere stad een unieke voor- en een achternaam in DNA-letters te geven en de verbinding ertussen samen te stellen uit de achternaam van het vertrekpunt en de voornaam van de aankomstplaats. Die verbindingen, de vluchtnummers als het ware, liet hij synthetiseren als enkelvoudige DNA-strengen van twintig letters.

Adleman had daarnaast ook de zogenaamde complementaire stadsnamen nodig, waar iedere A in de oorspronkelijke naam is vervangen door een T, iedere T door een A en net zo voor de G en C. Voor wie de biologische basiskennis wat roestig is: A en T, en G en C, vormen elkaars natuurlijke paren, die in de dubbele DNA-helix altijd tegenover elkaar zitten dankzij een onderling krachtenspel. Twee enkelvoudige, (bijna) complementaire strengen die elkaar in oplossing tegenkomen, wikkelen zich vanzelf tot een dubbele helix. Ook de complementaire stadsnamen liet Adleman synthetiseren.

’Ik nam een snufje van alle soorten DNA-strengen en deed ze in een reageerbuisje. Om de berekening te starten voegde ik water, een ligase (een enzym dat DNA-fragmenten aan elkaar plakt, PvG), zout en enkele andere ingrediënten toe om de condities in een cel na te bootsen. Alles bij elkaar is dat ongeveer een vijftiende theelepel aan vloeistof. Binnen een seconde hield ik het antwoord vast‘, beschreef Adleman in 1998 het cruciale deel van zijn baanbrekende experiment, dat in 1994 was bekroond met een publicatie in Science.

Elimineren

Wat gebeurde er in die reageerbuis? In figuur 2 is dat geïllustreerd met een sterk vereenvoudigd voorbeeld. In feite worden alle willekeurige paden langs de steden vastgelegd in stukjes DNA van verschillende lengtes. Dat is het noodzakelijke gevolg van het feit dat ieder vluchtnummer aan twee complementaire stadsnamen bindt, waarbij altijd een complementaire voor- en achternaam overblijven en ’uitsteken‘. Het ligase zorgt ervoor dat de twee complementaire steden permanent aan elkaar worden verbonden. Voor iedere uitgaande verbinding vanuit de bewuste steden zit er vervolgens in de reageerbuis een vluchtnummer met een helft die complementair is aan de uitsteeksels en die dus aan het oorspronkelijke stuk DNA bindt.

Dit proces herhaalt zich voor elke stad, net zo lang totdat er geen passende vluchtnummers meer zijn. Omdat er triljoenen stukjes DNA in de buis zaten – dat is het aardige van werken met moleculen – was de kans vrijwel 100 procent dat onder de ontelbare mogelijke oplossingen ook daadwerkelijk de oplossing zat. Dat is nog eens parallel rekenen.

Figuur 2. Adlemans handelsreizigers-’probleem‘ voor drie steden A, B en C, met verbindingen tussen A en B en tussen B en C, beginnend in A en eindigend in C, berekend met DNA. Vluchtnummer GCAGTCGG, tussen A en B, bindt zowel de complementaire namen van A als B aan zich, maar aan beide zijden blijven stukjes DNA vrij (situatie I). Die uitsteeksels kunnen ’doorgroeien‘, mits er een vluchtnummer met een deels complementaire volgorde aanwezig is. Dat is hier het geval, namelijk vluchtnummer ACTGGGCT, tussen B en C (situatie II). De resulterende DNA-streng GCAGTCGGACTGGGCT codeert voor de oplossing van het probleem.

Het vinden van deze oplossing is echter als zoeken naar een naald in een hooiberg, ware het niet dat er een aantal criteria zijn waaraan de juiste oplossing moet voldoen. Op basis daarvan kon Adleman foute antwoorden elimineren. Ten eerste had hij een enzym tot zijn beschikking dat, door de namen van het begin- en eindpunt slim te kiezen, alleen de oplossingen met de juiste begin- en eindpunten exponentieel vermenigvuldigde. Op die manier kon hij als het ware alle strengen in de buis met de juiste begin- en eindpunten zo sterk concentreren dat er zo goed als geen routes met verkeerde begin- en/of eindpunten meer in de oplossing waren.

Daarna gebruikte hij een scheidingstechniek om de DNA-stukken van de juiste lengte te isoleren. Immers, als je maar één keer langs een stad mag komen, is de lengte van de streng met de juiste oplossing van tevoren al bekend. En het laatste criterium dat Adleman kon gebruiken, was het feit dat de oplossing alle tussenliggende steden moet aandoen. Met een bewerkelijk iteratief proces viste hij alle strengen die niet aan dit criterium voldeden uit de oplossing. Als er daarna nog DNA in zijn buis aanwezig was, moest dat wel de oplossing zijn, wist Adleman.

Er zat inderdaad DNA in de buis, dat voor de juiste oplossing bleek te coderen. De eerste DNA-berekening was gemaakt, al had de hele procedure een week gekost.

Fata morgana

Even stond Adleman in het centrum van de computerwetenschappen. Met zijn ingenieuze experiment had hij moleculaire elementen uit de natuur naar zijn hand weten te zetten en een berekening laten doen die weliswaar triviaal, maar ook weer niet is gekunsteld. Daarmee was een heel nieuw wetenschappelijk veld blootgelegd en menig onderzoeker stond te trappelen om daar zijn tanden in te zetten. Oog voor de onpraktische aspecten was er nauwelijks, hoewel in het opinie-artikel dat Science tegelijk met de baanbrekende publicatie afdrukte reeds kritische noten werden geplaatst. Een Amerikaanse hoogleraar elektrotechniek sloot zelfs niet uit dat DNA de rol van silicium in chiptechnologie zou kunnen overnemen.

Vijf maanden na verschijning van Adlemans publicatie verzamelden zich zo‘n tweehonderd informatici en moleculair biologen zich op Princeton University, waar in alle haast een conferentie op poten was gezet. Ook daar waren kritische geluiden hoorbaar, maar optimisme had de overhand. Natuurlijk, er waren problemen, maar die horen bij de geboorte van een nieuwe discipline. Geef informatici de tijd om de materie tot op de bodem uit te diepen en moleculair biologen de gelegenheid hen handige nieuwe hulpmiddelen aan te reiken, en er komt een tijd dat DNA-computers worden ingezet bij op het oplossen van problemen die langs elektronische weg een brug te ver zijn.

Adleman zelf is altijd nuchter gebleven over zijn prestatie. Welke brandende kwesties waarvoor een DNA-computer in aanmerking komt om ze op te lossen, liggen er dan te wachten, vroeg hij zich af. Hij stelde zich tevreden met de wetenschap dat rekenen met DNA mogelijk is. Alhoewel, in 2002 herhaalde hij zijn kunststukje door het natuurpolymeer los te laten op een vervulbaarheidsprobleem waarvoor door meer dan een miljoen mogelijkheden moesten worden verkend. Zulke vraagstukken kan een mens zelf in ieder geval niet meer aan.

Nu, een jaar of tien en verschillende varianten op Adlemans procedure verder, is de consensus gegroeid dat het zo makkelijk nog niet is om de tekortkomingen van DNA-berekeningen te overwinnen. De methode-Adleman is tijdrovend – om niet te zeggen dodelijk saai – werk, dat alleen maar erger wordt naarmate grotere problemen onder handen worden genomen. Het verdient sowieso geen schoonheidsprijs dat er een uitvoerige ’nabewerking‘ van de mens nodig is om de juiste oplossing uit de reageerbuis te vissen. Hoewel er sindsdien meer geautomatiseerde implementaties zijn gepubliceerd, is nog altijd niet duidelijk of deze beperkingen ooit echt omzeild kunnen worden. Zoals het er nu voorstaat, rekent DNA supersnel dankzij ongekend parallellisme, maar is de normaal gesproken zo triviale print-out van de oplossing een crime.

Nog enkele andere kwesties gooien roet in het eten. Hoewel DNA wat informatiedichtheid conventionele media ver overtreft, is het plaatje voor de verwerking van informatie minder rooskleurig. Voor een handelsreizigersprobleem met tweehonderd in plaats van zeven steden zou evenveel DNA nodig zijn als het gewicht van de aarde, terwijl gewone computers al vraagstukken met tienduizenden steden hebben opgelost. Daarnaast werken enzymen niet feilloos. Met zeven steden en minder dan honderd mogelijkheden is de invloed daarvan verwaarloosbaar, maar omdat de kans op fouten exponentieel toeneemt, hebben grotere problemen daar al snel onder te lijden. Voor die grotere problemen zijn bovendien langere DNA-moleculen nodig, en hoe langer een DNA-molecuul, hoe groter de kans dat het breekt.

Tenslotte – het punt is al aangestipt – hebben onderzoekers het maar te doen met de elementen die de natuur hen aanreikt. Hoewel biologen tegenwoordig wel een beetje aan enzymen kunnen sleutelen, zijn ’designer-enzymen‘ met een in de natuur niet voorkomende werking nog lange tijd een fata morgana.

Dat wil niet zeggen dat rekenen met DNA een doodlopende weg is gebleken in termen van praktische toepasbaarheid: er is nog hoop. Toen de beperkingen waren ingedaald, hebben onderzoekers naar andere manieren gezocht om de eigenschappen van DNA uit te buiten voor rekenwerk. Daarover meer in deel 2 van deze serie, dat gaat over in vivo-berekeningen die tot intelligente medicijnen moeten leiden, en deel 3, waarin DNA wordt ingezet om nanoscopische rekensystemen zichzelf in elkaar te laten zetten.