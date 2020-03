Le logo du COVID-19 Open Research Dataset, ou CORD-19, est un coronavirus stylisé. (Graphique CORD-19)

Un consortium de chefs de file de la technologie – dont l’Institut de Seattle pour l’intelligence artificielle de Seattle, l’organisme de bienfaisance Mark Zuckerberg, PDG de Microsoft et Facebook – a dévoilé aujourd’hui une base de données compatible avec l’IA destinée à donner aux chercheurs un accès plus rapide et plus sûr aux ressources relatives au coronavirus et comment y mettre fin.

Le COVID-19 Open Research Dataset, ou CORD-19, a été créé en réponse à une demande du Bureau de la politique scientifique et technologique de la Maison Blanche. Il profite des outils de l’IA pour organiser plus de 24 000 articles sur la maladie COVID-19 et le coronavirus SARS-CoV-2 qui en est la cause.

“Nous pensons que l’IA a un rôle important à jouer dans la résolution de ce problème”, a déclaré Doug Raymond, directeur général du moteur de recherche académique Semantic Scholar au Allen Institute for Artificial Intelligence, également connu sous le nom d’AI2.

Le PDG d’AI2, Oren Etzioni, a déclaré que son équipe avait saisi l’opportunité de participer à CORD-19. “Nous avons tous hésité pendant deux secondes négatives”, a-t-il plaisanté.

La base de données CORD-19 a été construite sur les bases posées par Semantic Scholar et est hébergée sur le site Web de Semantic Scholar.

«Le problème principal est la surcharge d’informations dans la recherche», a expliqué Raymond. «Il existe des dizaines d’institutions qui ont publié des recherches sur le coronavirus. … Rassembler toutes les informations dans un format commun et complet est un énorme défi pour les chercheurs, et c’est une excellente application de nos capacités d’IA. »

Depuis des années, les chercheurs d’A! 2 utilisent des outils tels que l’apprentissage automatique et le traitement du langage naturel pour extraire des caractéristiques clés de la littérature scientifique et aider les chercheurs à trouver les études les plus pertinentes pour les problèmes qu’ils tentent de résoudre.

En 2018, AI2 s’est associé à Microsoft pour étendre la portée de Semantic Scholar. La base de données compatible avec l’IA contient désormais plus de 182 millions d’articles de recherche de tous les domaines scientifiques.

Microsoft joue un rôle similaire dans la conservation du contenu de CORD-19.

“Tout est sur le pont alors que nous sommes confrontés à la pandémie de COVID-19”, a déclaré Eric Horvitz, directeur scientifique de Microsoft, dans un communiqué de presse. «Nous devons nous rassembler en tant qu’entreprises, gouvernements et scientifiques et travailler pour mettre nos meilleures technologies au service de la biomédecine, de l’épidémiologie, de l’IA et d’autres sciences.»

La Bibliothèque nationale de médecine des National Institutes of Health a facilité l’accès à 10 000 articles savants sur le coronavirus. AI2 a transformé tout ce contenu et bien plus sous une forme lisible par machine, et a créé un flux adaptatif qui tient les utilisateurs informés des domaines de recherche qui les intéressent le plus.

L’initiative Chan Zuckerberg et le Center for Security and Emerging Technology de l’Université de Georgetown ont également contribué à cet effort.

CORD-19 continuera d’être mis à jour à mesure que de nouvelles recherches sur le coronavirus seront publiées sur des serveurs de préimpression et dans des publications à comité de lecture. Raymond a souligné que Semantic Scholar peut également relier la recherche universitaire aux données d’essais cliniques, aux archives de données GitHub et aux rapports non académiques basés sur la recherche.

Les chercheurs utilisant la base de données peuvent partager les outils d’exploration de données et les idées qu’ils développent en réponse à l’appel à l’action de CORD-19 via la communauté de science des données de Kaggle.

«Nous mettons cet ensemble de données devant notre communauté de 4,3 millions de scientifiques des données dans l’espoir que la communauté mondiale de l’IA puisse aider à trouver des réponses à un ensemble clé de questions sur COVID-19», Anthony Goldbloom, co-fondateur de Kaggle et PDG, a déclaré dans le communiqué de presse d’aujourd’hui.

Les questions clés ont été formulées en coordination avec des experts en maladies infectieuses de l’Organisation mondiale de la santé et un comité permanent des académies nationales des sciences, de l’ingénierie et de la médecine.

Michael Kratsios, directeur de la technologie à la Maison Blanche, a déclaré qu’une action décisive dans la communauté scientifique jouera un rôle essentiel dans la lutte contre l’épidémie de coronavirus. Il a appelé la communauté de recherche américaine à utiliser pleinement CORD-19.

“La Maison Blanche continuera d’être un partenaire solide dans cette approche tout-en-un”, a déclaré Kratsios. «Nous remercions chaque institution d’avoir prêté volontairement son expertise et son innovation à cet effort de collaboration.»

Raymond d’AI2 a déclaré que CORD-19 devrait fournir une nouvelle voie pour la science ouverte, conformément à la vision de Paul Allen, le co-fondateur de Microsoft qui a créé l’institut en 2014. Travailler sur CORD-19 donne également aux chercheurs qui font leur maison à Seattle, l’un des hotspots américains les plus chauds pour l’épidémie de coronavirus, un rôle pour aider à mettre fin à la crise.

«Nous en sommes tous touchés et nous sommes ravis de pouvoir contribuer quelque chose en fonction du travail que nous faisons tous les jours», a déclaré Raymond à .. «J’espère que cela aidera beaucoup de gens et aura un impact. C’est ce que Paul Allen voulait que nous puissions faire, nous avons donc l’impression d’y parvenir en partie. »