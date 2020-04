Si tout le monde devait compter sur la mémoire flash – le système de stockage de données utilisé dans les cartes mémoire et les clés USB – la quantité d’informations que le monde est censé produire d’ici 2040 dépasserait jusqu’à 100 le nombre attendu de silicium de qualité micropuce sur la planète. fois. Pour éviter une telle crise, les chercheurs ont exploré un matériau de stockage sur lequel la vie elle-même repose: l’ADN.

En théorie, cette substance peut contenir une grande quantité d’informations – jusqu’à un exaoctet (un milliard de gigaoctets) par millimètre cube d’ADN – pendant des millénaires. (La bande magnétique qui sert de base à la plupart des archives numériques a une durée de vie maximale d’environ 30 ans, mais l’ADN de fossiles vieux de 700 000 ans peut toujours être séquencé.) Un obstacle à la réalisation du stockage des données ADN, cependant, est le processus lent, coûteux et sujet aux erreurs de création ou de synthèse de nouvelles séquences d’ADN qui correspondent au code souhaité.

«La synthèse de l’ADN est un goulot d’étranglement majeur en ce qui concerne le coût d’enregistrement, la précision et la vitesse d’écriture», explique Olgica Milenkovic, théoricien du codage à l’Université de l’Illinois à Urbana-Champaign et coauteur principal d’une nouvelle étude sur le sujet. Elle et ses collègues ont suggéré une nouvelle solution: au lieu de synthétiser l’ADN à partir de zéro, marquez les molécules d’ADN existantes avec des motifs de «pseudos» pour encoder les données. Cette méthode a été inspirée par des cartes perforées – des bandes de papier rigide qui ont été perforées dans des positions spécifiques pour stocker des informations pour de nombreux premiers ordinateurs, y compris l’ENIAC de l’époque de la Seconde Guerre mondiale. Les chercheurs ont détaillé leur technique mercredi dans Nature Communications.

Les approches précédentes de stockage d’ADN traitaient les quatre composants clés de l’ADN connus sous le nom de bases – adénine, thymine, cytosine et guanine – comme les bits électroniques, les 1 et les 0 qui codent les données numériques. Par exemple, chaque base peut être assignée pour représenter la paire 00, 01, 10 ou 11. Mais au lieu de traduire une série de bits en code ADN et de synthétiser les chaînes de bases correspondantes, la nouvelle méthode traite le matériel génétique existant un peu comme le papier de ces premières cartes perforées. Il applique des enzymes comme «le dispositif qui fait des trous», explique l’auteur principal de l’étude, S. Kasra Tabatabaei, biologiste synthétique à Urbana-Champaign. Dans ce cas, les «trous» sont des liens coupés entre les molécules qui composent l’épine dorsale de l’ADN. La présence de cette marque signifie 1 et son absence symbolise 0.

L’aspect le plus intéressant de cette recherche est de savoir comment elle s’appuie sur la nature, explique Brenda Rubenstein, chimiste théorique à l’Université Brown, qui n’a pas participé à l’étude. Les chercheurs “ont laissé ces enzymes créer des entailles – faire ce qui leur est le plus naturel – pour stocker des informations”, dit-elle.

Pour placer les entailles avec précision, l’équipe a chauffé des molécules d’ADN double brin – imaginez chacune comme une échelle torsadée avec des barreaux constitués de paires de bases et des rails verticaux de sucres et de phosphates – jusqu’à ce qu’ils se déroulent un peu au milieu. Ce processus a essentiellement formé des bulles qui ont laissé les bases exposées. Ensuite, les scientifiques ont déployé des molécules d’ADN simple brin, chacune de seulement 16 bases de long, qui se sont accrochées aux séquences correspondantes de bases dans ces bulles. Les extrémités de ces molécules simple brin ont servi de guides, indiquant aux enzymes exactement où aller. Dans l’ADN, chaque base se connecte à une molécule de sucre et à un groupe phosphate pour former un composé appelé nucléotide. Les enzymes utilisées dans la nouvelle technique rompent la liaison reliant un nucléotide à un autre pour créer une entaille dans les rails sucre-phosphate.

Parce que cette méthode ne nécessite pas de synthétiser des séquences précises d’ADN, les chercheurs affirment que l’un de ses principaux avantages est qu’ils peuvent traiter pratiquement n’importe quelle molécule d’ADN comme une carte perforée. Par exemple, ils ont expérimenté avec du matériel génétique récolté à moindre coût à partir de souches facilement disponibles de bactéries Escherichia coli, dont les chercheurs connaissent les séquences avec une grande précision. À l’aide de brins d’ADN bactérien avec 450 paires de bases, contenant chacune de cinq à dix entailles, les scientifiques ont encodé les 272 mots de l’adresse d’Abraham Lincoln à Gettysburg – et une image de 14 kilo-octets du Lincoln Memorial. Après avoir placé ces informations sur l’ADN, ils ont utilisé des techniques de séquençage commerciales pour lire les fichiers avec une précision parfaite.

«Pendant de nombreuses années, les gens pensaient que l’informatique moléculaire impliquait de prendre ce que nous faisons dans le silicium et de le cartographier sur des molécules, ce qui a abouti à ces dispositifs Rube Goldberg élaborés», explique Rubenstein. “Au lieu de cela, ce nouveau travail a fait confiance à la façon dont les enzymes ont évolué au cours de millions et de millions d’années pour être incroyablement efficaces dans ce qu’elles font.”

Les scientifiques espèrent que leur processus pourrait s’avérer beaucoup moins cher et plus rapide que ceux qui reposent sur la synthèse de l’ADN. Ils affirment toutefois que les stratégies de conservation des données ADN proposées dans le passé offrent encore certains avantages, comme une densité de stockage environ 12 à 50 fois supérieure à la technique de la carte perforée. «Le plus gros problème avec le stockage de données ADN n’est pas la densité; ça coûte », dit Milenkovic. «Et nos coûts sont vraiment bas et peuvent être encore réduits.» De plus, ajoute-t-elle, les anciens systèmes de stockage d’ADN ont dû inclure des séquences redondantes, qui servent d’assurance contre la nature sujette aux erreurs de la synthèse d’ADN conventionnelle. Cette exigence réduit la quantité de données qu’ils peuvent réellement contenir, réduisant l’écart de densité de stockage entre eux et la nouvelle technique.