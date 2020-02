QUAND REGINA BARZILAY a eu une mammographie de routine au début de la quarantaine, l’image a montré une gamme complexe de taches blanches dans son tissu mammaire. Les marques peuvent être normales ou cancéreuses – même les meilleurs radiologues ont souvent du mal à faire la différence. Ses médecins ont décidé que les taches n’étaient pas immédiatement inquiétantes. Avec le recul, elle dit: “J’ai déjà eu un cancer, et ils ne l’ont pas vu.”

Au cours des deux années suivantes, Barzilay a subi une deuxième mammographie, une IRM mammaire et une biopsie, qui ont toutes continué à produire des résultats ambigus ou contradictoires. En fin de compte, elle a reçu un diagnostic de cancer du sein en 2014, mais le chemin vers ce diagnostic a été incroyablement frustrant. «Comment faites-vous trois tests et obtenez-vous trois résultats différents?», Se demande-t-elle.

Barzilay a été soigné et a bien récupéré. Mais elle est restée horrifiée que les incertitudes de la lecture d’une mammographie puissent retarder le traitement. «J’ai réalisé à quel point nous ne sommes pas protégés par les approches actuelles», dit-elle, alors elle a pris une décision qui modifiait sa carrière: «Je dois absolument la changer.»

Informaticien au Massachusetts Institute of Technology, Barzilay n’avait jamais étudié la santé auparavant. Ses recherches ont utilisé des techniques d’apprentissage automatique – une forme d’intelligence artificielle – pour le traitement du langage naturel. Mais elle cherchait une nouvelle ligne de recherche et a décidé de faire équipe avec des radiologues pour développer des algorithmes d’apprentissage automatique qui utilisent l’analyse visuelle supérieure des ordinateurs pour repérer des motifs subtils dans les mammographies que l’œil humain pourrait manquer.

Au cours des quatre années suivantes, l’équipe a enseigné un programme informatique pour analyser les mammographies d’environ 32 000 femmes d’âges et de races différents et lui a indiqué quelles femmes avaient reçu un diagnostic de cancer dans les cinq ans suivant l’examen. Ils ont ensuite testé les capacités de correspondance de l’ordinateur sur 3 800 patients supplémentaires. Leur algorithme résultant, publié en mai dernier dans Radiology, était significativement plus précis pour prédire le cancer – ou l’absence de cancer – que les pratiques généralement utilisées dans les cliniques. Lorsque l’équipe de Barzilay a dirigé le programme sur ses propres mammographies de 2012 – celles que son médecin avait approuvées – l’algorithme avait correctement prédit qu’elle courait un risque plus élevé de développer un cancer du sein en cinq ans que 98% des patientes.

Les algorithmes d’IA ne détectent pas seulement des détails trop subtils pour que l’œil humain puisse les voir. Ils peuvent également développer des façons entièrement nouvelles d’interpréter les images médicales, parfois d’une manière que les humains ne comprennent pas. Les nombreux chercheurs, start-ups et fabricants de scanners qui conçoivent des programmes d’IA espèrent pouvoir améliorer la précision et la rapidité des diagnostics, fournir un meilleur traitement dans les pays en développement et les régions éloignées qui manquent de radiologues, révéler de nouveaux liens entre la biologie et la maladie, et même aider à prédire combien de temps une personne va mourir.

Les applications d’IA entrent dans les cliniques à un rythme rapide, et les médecins ont rencontré la technologie avec autant d’enthousiasme quant à son potentiel à réduire leur charge de travail et à craindre de perdre leur emploi au profit des machines. Les algorithmes soulèvent également des questions sans précédent sur la façon de réguler une machine qui apprend et change constamment et qui est à blâmer si un algorithme se trompe de diagnostic. Pourtant, de nombreux médecins sont ravis de la promesse des programmes d’IA. «Si ces modèles peuvent être suffisamment contrôlés et que nous pouvons améliorer notre niveau de compréhension de la façon dont ils fonctionnent, cela peut aider à élever le niveau des soins de santé pour tout le monde», explique Matthew Lungren, radiologue à l’Université de Stanford.

“UN SUJET TRÈS, TRÈS CHAUD”

L’IDÉE D’UTILISER des ordinateurs pour lire des radiographies n’est pas nouvelle. Dans les années 1990, les radiologues ont commencé à utiliser un programme appelé diagnostic assisté par ordinateur (CAD) pour détecter le cancer du sein lors des mammographies. La technologie a été saluée comme révolutionnaire et les cliniques l’ont rapidement adoptée. Mais la CAO s’est avérée plus longue et plus difficile à utiliser que les méthodes existantes, et selon certaines études, les cliniques qui l’utilisaient ont fait plus d’erreurs que celles qui ne l’ont pas fait. L’échec a rendu de nombreux médecins douteux des diagnostics assistés par ordinateur, explique Vijay Rao, radiologue à l’Université Jefferson de Philadelphie.

Au cours de la dernière décennie, cependant, la vision par ordinateur s’est améliorée à pas de géant – dans les applications quotidiennes telles que la reconnaissance faciale et la médecine. L’avancée a été largement tirée par le développement de méthodes d’apprentissage en profondeur, dans lesquelles un ordinateur reçoit un ensemble d’images puis est laissé à établir ses propres connexions entre elles, développant finalement un réseau d’associations. En imagerie médicale, cela pourrait, par exemple, impliquer de dire à l’ordinateur quelles images contiennent le cancer et de le libérer pour trouver des caractéristiques communes à ces images mais absentes dans les images sans cancer.

Le développement et l’adoption des technologies de l’IA en radiologie se sont rapidement répandus. «L’an dernier, à chaque grande réunion à laquelle je me suis rendu, le thème principal était l’IA et l’imagerie», explique Rao, ancien président de la Radiological Society of North America. “De toute évidence, c’est un sujet très, très chaud.”

La Food and Drug Administration des États-Unis déclare qu’elle ne tient pas de liste des produits d’IA qu’elle a approuvés. Mais Eric Topol, chercheur en médecine numérique au Scripps Research Institute de La Jolla, en Californie, estime que l’agence approuve plus d’un algorithme d’imagerie médicale par mois. Une enquête réalisée en 2018 par la firme d’intelligence marketing Reaction Data a révélé que 84% des cliniques de radiologie américaines avaient adopté ou prévoyaient d’adopter des programmes d’IA. Le domaine se développe particulièrement rapidement en Chine, où plus de 100 entreprises conçoivent des applications d’IA pour les soins de santé.

«C’est un moment fascinant d’être sur ce marché», a déclaré Elad Walach, PDG de la start-up basée à Tel Aviv, Aidoc. La société développe des algorithmes pour analyser les tomodensitogrammes afin de détecter les anomalies et placer ces patients en tête de liste des priorités d’un médecin. Aidoc suit également la fréquence à laquelle les médecins utilisent le programme et combien de temps ils passent à deviner ses conclusions. «Au départ, ils sont sceptiques, mais après deux mois, ils s’y sont habitués et sont très confiants», dit Walach.

Gagner du temps peut être crucial pour sauver un patient. Une étude récente sur les radiographies pulmonaires pour les poumons effondrés a révélé que les radiologues signalent plus de 60 pour cent des analyses qu’ils commandent comme étant hautement prioritaires, ce qui suggère qu’ils pourraient passer des heures à patauger dans des cas non graves avant d’arriver à ceux qui sont réellement urgents. «Chaque médecin à qui je parle a une histoire où il a perdu un patient à cause d’un poumon effondré», explique Karley Yoder, vice-président et directeur général de l’IA chez GE Healthcare, à Boston, l’un des principaux fabricants d’équipements d’imagerie médicale. En septembre dernier, la FDA a approuvé un ensemble d’outils d’IA qui seront désormais intégrés dans les scanners GE, signalant automatiquement les cas les plus urgents.

Parce qu’ils peuvent traiter d’énormes quantités de données, les ordinateurs peuvent effectuer des tâches analytiques qui dépassent les capacités humaines. Google, par exemple, utilise sa puissance de calcul pour développer des algorithmes d’IA qui construisent des images CT bidimensionnelles des poumons en un poumon tridimensionnel et examinent la structure entière pour déterminer si un cancer est présent. Les radiologues, en revanche, doivent regarder ces images individuellement et tenter de les reconstruire dans leur tête. Un autre algorithme de Google peut faire quelque chose que les radiologues ne peuvent pas faire du tout: déterminer le risque de maladie cardiovasculaire des patients en regardant une analyse de leur rétine, en détectant les changements subtils liés à la pression artérielle, au cholestérol, aux antécédents de tabagisme et au vieillissement. “Il y a là un signal potentiel au-delà de ce qui était connu auparavant”, explique Daniel Tse, chef de produit Google.

LE PROBLÈME DE LA BOÎTE NOIRE

LES PROGRAMMES D’IA POURRAIENT FINIR, révélant des liens entièrement nouveaux entre les caractéristiques biologiques et les résultats pour les patients. Un article de 2019 dans JAMA Network Open décrit un algorithme d’apprentissage en profondeur formé sur plus de 85000 radiographies pulmonaires de personnes inscrites à deux grands essais cliniques qui les ont suivis pendant plus de 12 ans. L’algorithme a évalué le risque de décès de chaque patient au cours de cette période. Les chercheurs ont découvert que 53% des personnes que l’intelligence artificielle a placées dans une catégorie à haut risque sont décédées dans les 12 ans, contre 4% dans la catégorie à faible risque. L’algorithme ne contenait aucune information sur qui est décédé ou sur la cause du décès. L’enquêteur principal, le radiologue Michael Lu du Massachusetts General Hospital, a déclaré que l’algorithme pourrait être un outil utile pour évaluer la santé des patients s’il était combiné à l’évaluation d’un médecin et à d’autres données telles que la génétique.

Pour comprendre le fonctionnement de l’algorithme, les chercheurs ont identifié les parties d’images qu’il a utilisées pour effectuer ses calculs. Certains, comme le tour de taille et la structure des seins des femmes, avaient un sens, car ces zones peuvent faire allusion à des facteurs de risque connus de certaines maladies. Mais l’algorithme a également examiné la région sous les omoplates des patients, ce qui n’a aucune signification médicale connue. Lu suppose que la flexibilité pourrait être un prédicteur d’une durée de vie plus courte. Prendre une radiographie pulmonaire nécessite souvent que les patients prennent la machine dans leurs bras, et les personnes en moins bonne santé qui ne peuvent pas mettre leurs bras tout autour peuvent positionner leurs épaules d’une manière différente. “Ce ne sont pas des choses auxquelles j’aurais pensé de novo et qui pourraient ne pas comprendre”, explique Lu.

La déconnexion entre la façon dont les ordinateurs et les humains pensent est connue comme le problème de la boîte noire: l’idée qu’un cerveau d’ordinateur fonctionne dans un espace obscur inaccessible aux humains. Les experts divergent quant à savoir si cela présente un problème en imagerie médicale. D’une part, si un algorithme améliore constamment les performances des médecins et la santé des patients, les médecins n’ont pas besoin de savoir comment il fonctionne. Après tout, les chercheurs ne comprennent toujours pas complètement les mécanismes de nombreux médicaments tels que le lithium, qui est utilisé pour traiter la dépression depuis les années 1950. “Peut-être que nous ne devrions pas être aussi obsédés, parce que la façon dont les humains travaillent en médecine est à peu près aussi noire que possible”, explique Topol. “Avons-nous des machines à un niveau plus élevé?”

Néanmoins, il est indéniable que la boîte noire offre de nombreuses possibilités de malentendus entre l’IA humaine et l’IA. Par exemple, les chercheurs de l’École de médecine Icahn du Mont Sinaï ont été profondément perplexes face à un écart dans les performances d’un algorithme d’apprentissage en profondeur qu’ils avaient développé pour identifier la pneumonie dans les radiographies pulmonaires. Il a fonctionné avec une précision supérieure à 90% sur les rayons X produits au mont Sinaï, mais était beaucoup moins précis avec les scans d’autres institutions. Ils ont finalement compris qu’au lieu d’analyser simplement les images, l’algorithme tenait également compte des chances d’une conclusion positive basée sur la fréquence de la pneumonie dans chaque institution – pas quelque chose qu’ils attendaient ou voulaient que le programme fasse.

Des facteurs de confusion comme ceux-ci inquiètent Samuel Finlayson, qui étudie les applications biomédicales de l’apprentissage automatique à la Harvard Medical School. Il note que les ensembles de données sur lesquels l’IA est formée peuvent être biaisés d’une manière que les développeurs ne prennent pas en compte. Une image prise dans une salle d’urgence ou prise au milieu de la nuit peut être plus susceptible de montrer une personne malade qu’une photo prise lors d’un examen de routine, par exemple. Un algorithme pourrait également apprendre à examiner les cicatrices ou les implants de dispositifs médicaux qui indiquent un problème de santé antérieur et décider que les personnes sans ces marques n’avaient pas la condition. Même la façon dont les institutions étiquettent leurs images peut confondre un algorithme d’IA et empêcher le modèle de bien fonctionner dans une autre institution avec un système d’étiquetage différent. «Si vous vous entraînez naïvement [an algorithm] dans un hôpital à partir d’un endroit, d’une fois et d’un groupe de population, vous n’êtes pas au courant des milliers de petits facteurs que les modèles prennent en compte. Si l’un de ces changements change, vous pouvez être dans un monde de souffrance », prévient Finlayson.

La solution, dit Finlayson, est de former un algorithme avec des données provenant de nombreux endroits et dans diverses populations de patients, puis de les tester de manière prospective – sans aucune modification – dans une nouvelle population de patients. Mais très peu d’algorithmes ont été testés de cette façon. Selon la récente revue de Nature Medicine de Topol, parmi des dizaines d’études affirmant qu’une IA fonctionne mieux que les radiologues, seule une poignée a été testée dans des populations différentes de la population dans laquelle elles ont été développées. «Les algorithmes sont très, très délicats», explique Cynthia Rudin, informaticienne à Duke University. “Si vous essayez d’en utiliser un en dehors du kit d’entraînement [of images], cela ne fonctionne pas toujours. “

À mesure que les chercheurs prennent conscience de ce problème, de nouvelles études prospectives dans de nouveaux environnements pourraient se profiler. L’équipe de Barzilay a récemment terminé de tester sa mammographie AI sur 10 000 scans de l’Institut Karolinska en Suède et a constaté qu’elle fonctionnait aussi bien là-bas qu’au Massachusetts. Le groupe travaille actuellement avec des hôpitaux de Taïwan et de Détroit pour le tester dans des groupes de patients plus diversifiés. L’équipe a constaté que les normes actuelles pour évaluer le risque de cancer du sein sont beaucoup moins précises chez les femmes afro-américaines, dit Barzilay, parce que ces normes ont été développées principalement en utilisant des analyses de femmes blanches: «Je pense que nous sommes vraiment en mesure de réorganiser ce triste état des affaires. “

LEGAL TERRA INCOGNITA

Même si les conclusions de l’IA sont médicalement pertinentes, la boîte noire présente toujours un certain nombre de préoccupations d’un point de vue juridique. Si une IA obtient un diagnostic erroné, il peut être difficile de déterminer si le médecin ou le programme est en faute. «Beaucoup de mauvaises choses se produisent dans les soins de santé, et vous ne savez pas nécessairement pourquoi les mauvaises choses se sont produites», explique Nicholson Price, expert en droit de la santé à l’Université du Michigan. Si un système d’IA conduit un médecin à poser un diagnostic incorrect, le médecin peut ne pas être en mesure d’expliquer pourquoi et les données de l’entreprise sur la méthodologie du test sont susceptibles d’être un secret commercial étroitement gardé.

Les systèmes d’IA médicale sont encore trop récents pour avoir été contestés dans des poursuites pour faute professionnelle médicale, il n’est donc pas clair comment les tribunaux détermineront la responsabilité et quel type de transparence devrait être exigé.

La tendance à construire des algorithmes de boîte noire contrarie Rudin. Le problème vient du fait que la plupart des algorithmes médicaux sont construits en adaptant des outils d’apprentissage en profondeur développés pour d’autres types d’analyse d’images. “Il n’y a aucune raison pour laquelle vous ne pouvez pas construire un robot qui peut s’expliquer”, insiste-t-elle. Mais il est exponentiellement plus difficile de créer un algorithme transparent à partir de zéro que de réutiliser un algorithme de boîte noire existant pour examiner les données médicales. C’est pourquoi Rudin soupçonne la plupart des chercheurs de laisser un algorithme fonctionner et d’essayer de comprendre plus tard comment il est arrivé à sa conclusion.

Rudin développe des algorithmes d’IA transparents qui analysent les mammographies des tumeurs suspectées et informent constamment les chercheurs de ce qu’ils font. Mais ses recherches ont été contrecarrées par le manque d’images disponibles sur lesquelles former l’algorithme. Les images qui sont accessibles au public ont tendance à être mal étiquetées ou prises avec de vieilles machines qui ne sont plus utilisées, dit Rudin, et sans d’énormes ensembles de données diversifiés, les algorithmes ont tendance à détecter des facteurs de confusion.

Les boîtes noires, ainsi que la capacité d’un algorithme d’IA à tirer des leçons de l’expérience, posent également des défis aux régulateurs. Contrairement à un médicament, qui fonctionnera toujours de la même manière, les algorithmes d’apprentissage automatique changent et s’améliorent avec le temps à mesure qu’ils accèdent à davantage de données sur les patients. Parce que l’algorithme tire son sens de tant de types d’entrées, des changements apparemment anodins tels qu’un nouveau système informatique dans un hôpital pourraient soudainement ruiner le programme d’IA. «Les machines peuvent tomber malades tout comme les humains tombent malades, et elles peuvent être infectées par des logiciels malveillants», explique Topol. “Vous ne pouvez pas faire confiance à un algorithme lorsque la vie de quelqu’un est en jeu.”

En avril dernier, la FDA a proposé un ensemble de directives pour gérer les algorithmes qui évoluent avec le temps. Parmi eux, on s’attend à ce que les producteurs surveillent l’évolution de leurs algorithmes pour s’assurer qu’ils continuent de fonctionner comme prévu et leur demandent d’avertir l’agence s’ils constatent des changements inattendus qui pourraient entraîner une réévaluation. L’agence élabore également les meilleures pratiques de fabrication et pourrait demander aux entreprises d’exprimer leurs attentes quant à la façon dont les algorithmes pourraient changer et un protocole pour gérer ces changements. «Nous devons comprendre que pas une seule taille ne convient à tous», explique Bakul Patel, directeur de la santé numérique à la FDA.

LES MACHINES REMPLACERONT-ELLES LES MÉDECINS?

LES LIMITES DE L’IA devraient rassurer les radiologues qui s’inquiètent des machines qui prennent leur travail. En 2012, le capital-risqueur technologique et cofondateur de Sun Microsystems, Vinod Khosla, a horrifié un public médical en prédisant que les algorithmes remplaceraient 80% des médecins, et plus récemment, il a affirmé que les radiologues qui pratiquaient encore dans 10 ans «tueraient des patients». panique et contrecoup dans le domaine de la radiologie, dit Rao. “Je pense que le battage médiatique crée beaucoup d’attentes.”

Mais cette préoccupation a également eu des répercussions réelles. En 2015, seulement 86% des postes de résidents en radiologie aux États-Unis étaient comblés, contre 94% l’année précédente, bien que ces chiffres se soient améliorés au cours des dernières années. Et selon un sondage de 2018 auprès de 322 étudiants en médecine au Canada, 68% croyaient que l’IA réduirait la demande de radiologues.

Pourtant, la plupart des experts et des fabricants d’IA doutent que l’IA remplacera bientôt les médecins. «Les solutions d’IA deviennent très efficaces pour faire une chose très bien», explique Walach. Mais parce que la biologie humaine est complexe, dit-il, “vous devez généralement avoir des humains qui font vraiment bien plus d’une chose.” En d’autres termes, même si un algorithme est meilleur pour diagnostiquer un problème particulier, en le combinant avec l’expérience d’un médecin et la connaissance de l’histoire individuelle du patient conduira à de meilleurs résultats.

Une IA capable de bien faire une seule tâche pourrait libérer les radiologistes des travaux pénibles, leur laissant plus de temps pour interagir avec les patients. «Ils pourraient sortir du sous-sol, où ils vivent dans l’obscurité», explique Topol. «Ce dont nous avons besoin en médecine, c’est de plus de contacts et de liens interhumains.»

Pourtant, Rao et d’autres pensent que les outils et la formation que reçoivent les radiologistes, y compris leur travail quotidien, changeront radicalement au cours des prochaines années grâce aux algorithmes d’intelligence artificielle. «L’IA ne remplacera pas les radiologistes, mais les radiologistes qui utilisent l’IA remplaceront les radiologistes qui ne le font pas», explique Curtis Langlotz, radiologue à Stanford.

Il existe cependant quelques exceptions. En 2018, la FDA a approuvé le premier algorithme qui peut prendre une décision médicale sans avoir besoin d’un médecin pour regarder l’image. Le programme, développé par IDx Technology à Coralville, Iowa, examine des images rétiniennes pour détecter la rétinopathie diabétique et est précis à 87%, selon les données de la société. Le PDG d’IDx, Michael Abramoff, a déclaré qu’en raison de l’absence de médecin, la société a assumé la responsabilité légale de toute erreur médicale.

À court terme, les algorithmes d’IA sont plus susceptibles d’aider les médecins que de les remplacer. Par exemple, les médecins travaillant dans les pays en développement peuvent ne pas avoir accès aux mêmes types de scanners qu’une grande institution médicale aux États-Unis ou en Europe ou des radiologistes qualifiés qui peuvent interpréter les scans. Au fur et à mesure que la médecine se spécialise et dépend de l’analyse de l’image, l’écart entre le niveau de soins dispensé dans les zones les plus riches et les plus pauvres se creuse, explique Lungren. L’exécution d’un algorithme peut être un moyen peu coûteux de combler cet écart et peut même être effectuée sur un téléphone mobile.

Le groupe de Lungren développe un outil qui permet aux médecins de prendre des photos de téléphone portable d’un film radiographique – pas les numérisations numériques qui sont standard dans les pays riches – et d’exécuter un algorithme sur les photographies qui détecte des problèmes tels que la tuberculose. «Cela ne remplace personne», dit-il – de nombreux pays en développement n’ont pas de radiologistes en premier lieu. «Nous augmentons le nombre de non-radiologues pour leur apporter une expertise à portée de main.»

Un autre objectif à court terme de l’IA pourrait être d’examiner les dossiers médicaux pour déterminer si un patient a besoin d’une analyse en premier lieu, dit Rao. De nombreux économistes médicaux pensent que l’imagerie est surutilisée – plus de 80 millions de tomodensitogrammes sont effectués chaque année aux États-Unis seulement. Bien que cette abondance de données soit utile aux chercheurs qui l’utilisent pour former des algorithmes, les analyses sont extrêmement coûteuses et peuvent exposer les patients à des quantités inutiles de rayonnement. De même, Langlotz ajoute que les algorithmes pourraient un jour analyser les images alors qu’un patient est encore dans le scanner et prédire le résultat final, réduisant ainsi le temps et l’exposition aux radiations nécessaires pour obtenir une bonne image.

En fin de compte, dit Barzilay, l’IA sera plus utile lorsqu’elle servira de partenaire aux yeux vifs pour résoudre des problèmes que les médecins ne peuvent pas détecter et résoudre seuls. «S’il y avait un modèle commode et descriptible», note-t-elle, «les humains seraient déjà en mesure de le faire.» Elle sait de première main que, trop souvent, ce n’est pas le cas.