Le 28 février 2003, le monde scientifique célébrera un anniversaire très spécial. C’est ce jour-là, il y a cinquante ans, que James Watson et Francis Crick ont découvert la structure de l’ADN – l’essence même de la vie. Depuis lors, la recherche sur l’ADN a permis aux biologistes de mieux comprendre la vie et de créer d’innombrables outils utiles qui ont de vastes applications pour la science et la société. Toutefois, ce n’est qu’au début des années 1990 que les chercheurs ont commencé à explorer la possibilité d’utiliser la capacité de l’ADN à stocker et à traiter des informations en dehors du domaine de la biologie. En 1994, une étude américaine de preuve de principe a montré que l’ADN pouvait être utilisé pour résoudre des problèmes mathématiques, ce qui a suscité un intérêt considérable chez les chercheurs qui espéraient que l’ADN remplacerait un jour le silicium comme base d’une nouvelle vague d’ordinateurs. Mais l’enthousiasme initial est retombé depuis, car les scientifiques se sont rendu compte que l’informatique par l’ADN présentait de nombreux problèmes et qu’ils devraient vivre avec leurs ordinateurs en silicium pendant un certain temps encore. Le domaine a par conséquent changé d’orientation et, pour l’essentiel, la recherche sur l’informatique de l’ADN consiste désormais principalement à « étudier les processus dans les cellules qui peuvent être considérés comme des calculs logiques, puis à chercher à utiliser ces calculs à notre avantage », comme l’a décrit Martyn Amos de l’université d’Exeter, au Royaume-Uni.
Un mélange de 1 018 brins d’ADN pourrait fonctionner à une vitesse 10 000 fois supérieure à celle des superordinateurs avancés d’aujourd’hui
C’est Leonard Adleman, professeur d’informatique et de biologie moléculaire à l’Université de Californie du Sud, aux États-Unis, qui a été le pionnier dans ce domaine lorsqu’il a construit le premier ordinateur basé sur l’ADN (L. M. Adleman, Science 266, 1021-102 ; 1994 ). Intrigué par l’immense capacité de la molécule à stocker des informations dans un espace très réduit, il a entrepris de résoudre une énigme classique en mathématiques – le problème du chemin de Hamilton, mieux connu sous le nom de problème du vendeur itinérant. Cette énigme apparemment simple – un vendeur doit visiter un certain nombre de villes reliées entre elles par une série limitée de routes, sans passer par aucune ville plus d’une fois – est en fait assez difficile à résoudre, et même les superordinateurs les plus avancés mettraient des années à calculer l’itinéraire optimal pour 50 villes. Adleman a résolu le problème pour sept villes en une seconde, en utilisant des molécules d’ADN dans un tube de réaction standard. Il a représenté chacune des sept villes sous forme de molécules d’ADN distinctes, à brin unique, de 20 nucléotides de long, et tous les chemins possibles entre les villes sous forme de molécules d’ADN composées des dix derniers nucléotides de la ville de départ et des dix premiers nucléotides de la ville d’arrivée. Le mélange des brins d’ADN avec de l’ADN ligase et de l’adénosine triphosphate (ATP) a permis de générer tous les chemins aléatoires possibles à travers les villes. Cependant, la majorité de ces chemins ne s’appliquaient pas à la situation – ils étaient soit trop longs, soit trop courts, ou encore ils ne commençaient ou ne finissaient pas dans la bonne ville. Adleman a ensuite filtré tous les chemins qui ne commençaient ni ne se terminaient par la bonne molécule et ceux qui n’avaient pas la longueur et la composition correctes. Toutes les molécules d’ADN restantes représentaient une solution au problème.
La puissance contenue dans ces minuscules molécules a provoqué une vague d’enthousiasme dans le monde de l’informatique
Le calcul dans l’expérience d’Adleman avançait à une vitesse de 1 014 opérations par seconde, soit un taux de 100 Teraflops ou 100 trillions d’opérations en virgule flottante par seconde ; le superordinateur le plus rapide du monde, Earth Simulator, appartenant à la NEC Corporation au Japon, tourne à seulement 35,8 Teraflops. Il est clair que le calcul par l’ADN présente des avantages considérables par rapport aux machines à base de silicium. Alors que la technologie actuelle repose sur un principe de logique très linéaire et qu’un calcul doit être achevé avant que le suivant puisse commencer, l’utilisation de l’ADN permet d’effectuer un nombre énorme de calculs simultanément. Cette puissance parallèle est plusieurs fois plus rapide que celle des machines traditionnelles – un mélange de 1 018 brins d’ADN pourrait fonctionner à une vitesse 10 000 fois supérieure à celle des superordinateurs de pointe actuels. L’autre avantage majeur est le potentiel de stockage de l’information. Alors que les supports de stockage traditionnels, comme les bandes vidéo, nécessitent 1012 nanomètres cubes d’espace pour stocker un seul bit d’information, les molécules d’ADN n’ont besoin que d’un nanomètre cube par bit. Il n’est pas surprenant que la puissance contenue dans ces minuscules molécules ait suscité un vif intérêt dans le monde de l’informatique, et beaucoup espéraient que « l’informatique ADN pourrait dépasser la technologie basée sur le silicium », a commenté Ron Weiss, professeur d’ingénierie électrique à l’Université de Princeton, New Jersey, USA Fig. 1.
Le principe de l’ordinateur à ADN de Leonard Adleman pour résoudre le problème du ‘Voyageur de commerce’.
C’était il y a huit ans, cependant, et bien que le potentiel de l’ordinateur à ADN semblait énorme, les recherches effectuées depuis ont montré qu’il était limité par des contraintes majeures. Le fait de représenter toutes les solutions possibles à un problème sous forme de brins d’ADN permet d’effectuer le calcul rapidement, mais « il faut effectuer une recherche exhaustive pour trouver une petite aiguille dans une grande botte de foin », a déclaré M. Amos, et cela nécessite une ressource exponentielle en termes de mémoire. Bien que l’ADN puisse stocker un trillion de fois plus d’informations que les supports de stockage actuels, la manière dont l’information est traitée nécessite une quantité massive d’ADN si l’on veut résoudre des problèmes à grande échelle. « On a estimé que si l’on étendait le problème du chemin de Hamilton à 200 villes à partir des sept villes d’Adleman, le poids de l’ADN nécessaire pour représenter toutes les solutions possibles dépasserait le poids de la terre », a déclaré M. Amos. En outre, même si le processus de calcul se déroule à une vitesse impressionnante, l' »impression » du résultat est atrocement lente et comporte de nombreuses étapes – il a fallu à Adleman une semaine de travail en laboratoire pour extraire les solutions potentielles de son cocktail d’ADN.
Le consensus général est désormais que le calcul par ADN ne pourra jamais concurrencer directement la technologie basée sur le silicium
Il existe également des problèmes concernant la précision du processus. La synthèse des brins d’ADN est susceptible d’erreurs, comme des paires mal assorties, et dépend fortement de la précision des enzymes impliquées. Bien que cela n’ait pas affecté le travail d’Adleman, il n’a traité que moins de 100 possibilités ; un ordinateur pleinement opérationnel devrait effectuer des milliers et des milliers de calculs, ce qui signifie que le risque d’erreurs augmente de manière exponentielle. En outre, à mesure que des molécules plus compliquées sont nécessaires pour des procédures plus complexes, la taille des molécules augmente, tout comme leur probabilité de cisaillement, ce qui contribue à nouveau aux erreurs Fig. 2.
La machine de Turing moléculaire d’Ehud Shapiro.
Weiss n’est pas confiant quant à la possibilité de surmonter ces problèmes techniques, un sentiment partagé par d’autres personnes dans le domaine. Le consensus général est maintenant que, en raison de ces limitations, l’informatique ADN ne pourra jamais concurrencer directement la technologie basée sur le silicium. Cela ne signifie pas pour autant que le calcul par l’ADN est mort, loin de là. Mais les problèmes ont obligé à repenser la question et « l’accent a été déplacé de l’objectif initial », selon M. Amos. Il pense que l’informatique de l’ADN a encore un grand potentiel, mais pour lui, « le riche potentiel de l’informatique de l’ADN réside dans l’informatique in vivo », c’est-à-dire l’utilisation de la technologie à plus petite échelle, à l’intérieur des cellules. Pour Weiss, l’objectif réaliste est de « démontrer le contrôle au niveau moléculaire ».
Une démonstration de cet objectif a été réalisée il y a deux ans par le groupe d’Ehud Shapiro à l’Institut Weizmann en Israël (Y. Benenson et al. . Nature 414, 430-434 ; 2001 ), qui a construit une machine informatique programmable et autonome faite de biomolécules. Cet « automate » est similaire à l’hypothétique machine de Turing développée par le mathématicien britannique Alan Turing (1912-54) en 1936, un dispositif qui convertit l’information d’une forme à une autre et opère sur une séquence finie de symboles – la machine de Shapiro utilise deux « entrées ». Sur la base d’une série de règles de transition, la machine change son état interne en fonction de l’état actuel et de l’entrée jusqu’à ce qu’elle atteigne un « état final » lorsque toutes les entrées ont été traitées. L’automate de Shapiro utilise des endonucléases de restriction et une ligase comme « matériel » pour modifier l’état de la machine, et de l’ADN double brin comme entrées et règles de transition. Le « logiciel » ADN est continuellement ligaturé et coupé par les enzymes, jusqu’à ce qu’il atteigne un état final – une extrémité collante définie – auquel un ADN « rapporteur » est ligaturé, mettant ainsi fin au calcul. M. Shapiro espère pouvoir développer ce concept très simple et construire des modèles de plus en plus compliqués jusqu’à ce qu’il soit en mesure de construire une machine de Turing moléculaire entièrement opérationnelle. Il s’agirait d’un véritable exploit, car une machine de Turing est capable d’effectuer toutes les opérations mathématiques et est considérée comme la base des ordinateurs actuels. Il est difficile de prévoir s’il pourra atteindre son objectif mais « la direction est prometteuse », a-t-il ajouté.
Comme l’a dit Shapiro, « beaucoup d’informations sont disponibles sous forme de molécules biologiques. Si vous pouvez les programmer et répondre à ces informations, alors vous pouvez faire beaucoup de choses. » Sa vision à long terme est « de créer des machines de calcul moléculaire capables d’analyser les situations dans les cellules, puis de synthétiser des molécules pour y faire face. » Les applications potentielles d’une telle technologie sont vastes. L’utilisation de cellules programmées comme « sentinelles biologiques », comme les a surnommées Weiss, pourrait avoir des applications évidentes dans la lutte contre les maladies, en reconnaissant les cellules ou les tissus endommagés et en signalant le problème ou, mieux encore, en effectuant la libération de molécules réparatrices.
Une autre direction prometteuse est l’auto-assemblage moléculaire de l’ADN pour construire des structures moléculaires complexes, qui pourrait avoir un impact sur d’autres domaines, comme les nanotechnologies. Eric Winfree, de l’Institut de technologie de Californie, aux États-Unis, a consacré beaucoup de temps à ce sujet et a mis au point une méthode pour construire des « tuiles » moléculaires – de minuscules blocs d’ADN. En programmant les bords de ces tuiles, il est parvenu à forcer l’ADN à s’assembler en de minuscules motifs moléculaires. Cependant, il n’a pu jusqu’à présent construire que des structures simples et, dit-il, « nous devons arriver au point où nous pouvons construire des modèles compliqués ».
Cependant, comme l’a souligné Amos, « tout cela n’est que du ciel bleu pour le moment ». Toutes ces recherches n’en sont encore qu’au stade de la preuve de principe, et il faudra attendre au moins cinq à dix ans avant de voir des applications pratiques. Il est clair que l’informatique par l’ADN ne rivalisera pas avec les machines actuelles à base de silicium et « elle n’affectera pas notre mode de vie », a déclaré M. Weiss. Cependant, la véritable excitation dans ce domaine réside dans le fait de réunir des biologistes, des chimistes, des informaticiens et des mathématiciens pour comprendre et simuler les processus biologiques fondamentaux et les algorithmes qui se déroulent dans les cellules. « Nous ne devrions pas chercher à concurrencer les machines traditionnelles, mais plutôt à trouver une niche pour d’autres applications », a déclaré M. Amos. Toutefois, a-t-il ajouté, « si je suis honnête, la bio-informatique doit encore établir cette niche. »