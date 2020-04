Les progrès scientifiques des derniers siècles n’ont pas seulement permis une meilleure compréhension de l’univers; ils ont élevé le niveau de vie de nombreuses personnes à travers le monde. Cependant, il y a encore d’énormes défis que nous sommes mal équipés pour relever, comme en témoignent les changements climatiques et la pandémie de COVID-19, qui ont montré que nous devons encore comprendre la complexité de la nature. Pour faire face à l’ampleur des problèmes auxquels l’humanité est actuellement confrontée, des solutions radicales sont nécessaires – et les percées scientifiques seront au cœur de ce processus. L’intelligence artificielle promet d’accélérer les découvertes fondamentales en approfondissant la nature des questions que les chercheurs peuvent poser.

Dans son essai visionnaire «As We May Think», publié en 1945, l’éminent ingénieur américain et défenseur des sciences Vannevar Bush a prédit que les gens devraient bientôt compter sur des appareils externes pour augmenter leur esprit. Même alors, il pouvait voir que le taux de découvertes scientifiques était si grand que le besoin de stocker, de traiter et de comprendre les informations dépassait déjà la capacité biologique des gens.

Son observation prémonitoire sonne plus vrai que jamais: l’un des défis de la science moderne est de donner un sens à la grande quantité d’informations que nous avons recueillies sur le monde. Compte tenu de l’échelle des données générées par la science – du Grand collisionneur de hadrons aux projets massifs de génome – il est impossible pour une personne individuelle de tout analyser. L’IA est là pour nous aider à transformer cette abondance d’informations en compréhension, nous permettant de poser des questions qui seraient difficiles à résoudre pour les individus.

Les scientifiques utilisent depuis longtemps l’informatique pour faire avancer la science, utilisant des programmes informatiques pour modéliser et simuler des systèmes naturels pour expliquer et comprendre les phénomènes scientifiques. Cette approche a été incroyablement fructueuse pour la science et a alimenté des avancées allant de la simulation d’atomes aux modèles de l’univers. Cependant, ce paradigme classique est limité par sa dépendance à l’égard des programmeurs humains qui doivent d’abord distiller les règles des théories et des observations, puis utiliser ces règles pour coder les comportements d’un programme. Notre espoir est d’utiliser les systèmes d’IA pour déduire ces règles directement des données ou de l’expérience, et potentiellement aller au-delà de ce que les chercheurs individuels pourraient déchiffrer. Ces systèmes d’auto-apprentissage peuvent explorer des solutions et des stratégies potentielles en découvrant les propriétés cachées de la structure sous-jacente d’immenses ensembles de données, et peuvent donc augmenter, plutôt que se limiter à, la compréhension humaine.

Un point crucial est donc de trouver les bons problèmes à explorer pour ces systèmes. Bien que beaucoup de travail soit fait pour appliquer l’IA aux sciences, il n’est pas nécessaire qu’une application directe de ces technologies entraîne (ou doive) entraîner une percée dans chaque problème scientifique. Les progrès les plus percutants proviendront de l’application de techniques d’IA à des questions qui importent vraiment à la société et pour lesquelles des capacités de raisonnement et d’analyse sophistiquées sont requises. Une grande partie de l’art de résoudre un problème réside dans la sélection de la bonne question en premier lieu, un point crucial est donc de trouver les bons problèmes à explorer par ces systèmes.

Par exemple, l’une des questions ouvertes les plus importantes en biologie est de comprendre comment les protéines prennent leurs formes. Les protéines sont essentielles au fonctionnement sain du corps et agissent comme des machines miniatures dans les cellules pour effectuer les nombreuses tâches de la vie. La forme d’une protéine dicte sa fonction, c’est pourquoi tant de groupes de recherche se consacrent à la découverte de la structure de différentes protéines; une fois que la forme d’une protéine est connue, les chercheurs peuvent mieux comprendre comment elle fonctionne et rechercher les médicaments qui interagissent avec elle lorsqu’elle fonctionne mal dans les maladies. Il se trouve que c’est une application parfaite pour l’IA, car nous avons des ensembles de données relativement importants de structures protéiques connues pour entraîner les systèmes, et c’est un problème pour lequel nous pouvons quantifier les progrès.

Les scientifiques pourraient passer des années à déterminer la forme d’une seule protéine en utilisant des méthodes expérimentales qui prennent du temps comme la cristallographie. Au lieu de déterminer la forme d’une protéine à la fois, que faire si nous pouvions utiliser les données existantes pour enseigner à un système d’IA comment prédire la forme de n’importe quelle protéine naturelle ou même théoriquement possible uniquement à partir de sa description de séquence d’acides aminés. Basé sur des techniques d’apprentissage inspirées des neurosciences, notre modèle AlphaFold récemment publié peut s’entraîner sur de grands ensembles de données de structures protéiques connues pour prédire comment une chaîne unidimensionnelle d’acides aminés se replie en une forme tridimensionnelle.

En utilisant ce système, nous avons récemment généré des prédictions pour les formes de six protéines comprenant le SRAS-CoV-2, le virus qui cause COVID-19. Bien que les structures prédites par notre méthode ne conduisent pas directement à une guérison, elles peuvent fournir des conseils utiles aux chercheurs travaillant sur des médicaments et des anticorps qui pourraient agir contre le virus, et peuvent enrichir notre compréhension de cette menace mondiale pour la santé.

De nombreux groupes académiques ont fait des progrès constants sur le problème du repliement depuis des années, comme en témoignent les améliorations de la précision de CASP, une compétition semestrielle de prédiction du repliement des protéines. En 2018, AlphaFold a remporté les honneurs au CASP13, ce qui représente une amélioration de 40% de la précision par rapport au meilleur modèle de la compétition précédente. À l’avenir, cette approche pourrait aider les scientifiques à se concentrer sur les pistes les plus prometteuses, en économisant du temps et de l’argent, par exemple, dans le processus de développement de médicaments notoirement coûteux. Grâce à des simulations basées sur l’IA, il peut être possible de concevoir de nouvelles protéines in silico, puis de les tester dans le monde réel, aidant ainsi les chercheurs à diriger les efforts de recherche et à financer plus efficacement.

C’est la beauté de l’IA: elle permettra l’abstraction du particulier au général, distillant les principes unificateurs de l’expérience. Il approfondit la nature des questions que les scientifiques peuvent poser: pas simplement «quelle est la forme de la protéine X?» mais, plus fondamentalement, “qu’est-ce qui dicte la forme d’une protéine?” Chercher une question comme celle-ci n’apporte pas une réponse, mais beaucoup, ouvrant de nouveaux champs d’enquête entiers.

Si nous pouvons faire des progrès suffisants pour prédire comment les protéines prendront forme, nous pourrions faciliter la conception de nouveaux médicaments, enzymes et vaccins universels, ce qui entraînera d’innombrables avantages sociaux. De même, si nous pouvons utiliser l’IA pour simuler fidèlement des collections d’atomes, il pourrait être possible de concevoir rationnellement de nouveaux matériaux pour les batteries, la technologie de l’énergie solaire, la capture du carbone et plus encore. Étant donné la bonne question, les bonnes données de formation et la capacité de quantifier l’apprentissage, les systèmes d’IA devraient approfondir notre compréhension scientifique et accélérer de nouvelles percées technologiques. L’IA est bien plus que l’automatisation de la classification d’images ou la rationalisation des chaînes d’approvisionnement; nous voulons l’utiliser pour découvrir de nouvelles connaissances sur l’univers, et utiliser cette compréhension pour améliorer le monde.