L’intelligence artificielle et l’apprentissage automatique sont de plus en plus courants dans la recherche et la vie quotidienne, suscitant des inquiétudes quant au fonctionnement de ces algorithmes et aux prédictions qu’ils font. Par exemple, lorsque Apple a publié sa carte de crédit au cours de l’été, certains ont prétendu que les femmes bénéficiaient d’une limite de crédit inférieure à celle des hommes par ailleurs identiques. En réponse, la sénatrice Elizabeth Warren a averti que les femmes «auraient pu être victimes de discrimination, selon un algorithme inconnu».

À première vue, sa déclaration semble contredire le fonctionnement des algorithmes. Les algorithmes sont des fonctions et processus mathématiques logiques, alors comment peuvent-ils discriminer une personne ou un certain groupe démographique?

La création d’un algorithme qui discrimine ou montre un biais n’est pas aussi difficile qu’il y paraît, cependant. En tant qu’étudiant diplômé de première année, mon conseiller m’a demandé de créer un algorithme d’apprentissage automatique pour analyser une enquête envoyée aux professeurs de physique américains sur l’enseignement de la programmation informatique dans leurs cours. Bien que la programmation soit une compétence essentielle pour les physiciens, de nombreux programmes de premier cycle en physique n’offrent pas de cours de programmation, laissant les instructeurs individuels décider s’ils doivent enseigner la programmation.

La tâche semblait assez simple. Je commencerais par un algorithme dans la bibliothèque scikit-learn de Python pour créer mon algorithme afin de prédire si un répondant à l’enquête avait de l’expérience dans l’enseignement de la programmation. Je fournirais les réponses de l’instructeur de physique à l’enquête et exécuterais l’algorithme. Mon algorithme me dirait alors si les instructeurs enseignaient la programmation et quelles questions de l’enquête étaient les plus utiles pour faire cette prédiction.

Cependant, lorsque j’ai fait cela, j’ai remarqué un problème. Mon algorithme a continué à trouver que seules les questions à réponse écrite (et aucune des questions à choix multiple) différenciaient les deux groupes d’instructeurs. Lorsque j’ai analysé ces questions en utilisant une technique différente, je n’ai trouvé aucune différence entre les instructeurs qui enseignaient et n’enseignaient pas la programmation! Il s’est avéré que j’avais utilisé le mauvais algorithme tout le temps.

Mon exemple peut sembler idiot. Et si je choisis le mauvais algorithme pour prédire quels instructeurs enseignent la programmation? Mais que se passerait-il si j’avais plutôt créé un modèle pour prédire quels patients devraient recevoir des soins supplémentaires? L’utilisation d’un mauvais algorithme pourrait alors être un problème important.

Pourtant, ce n’est pas hypothétique comme l’a montré une étude récente dans Science. Dans l’étude, les chercheurs ont examiné un algorithme créé pour trouver des patients qui pourraient convenir à un programme de «gestion des soins à haut risque». Pour les patients blancs et noirs, l’algorithme identifié comme présentant un risque égal, le patient noir était plus malade que le patient blanc. Ainsi, même si le patient noir était plus malade que le patient blanc, l’algorithme considérait les deux patients comme ayant des besoins égaux.

Tout comme dans mes recherches, la société de soins de santé avait utilisé le mauvais algorithme. Les concepteurs de l’algorithme l’ont créé pour prédire les coûts des soins de santé plutôt que la gravité de la maladie. En conséquence, étant donné que les patients blancs ont un meilleur accès aux soins et dépensent donc plus en soins de santé, l’algorithme a attribué aux patients blancs, qui étaient moins malades, le même niveau de risque que les patients noirs plus malades. Les chercheurs affirment que des algorithmes similaires sont appliqués à environ 200 millions d’Américains chaque année, alors qui sait combien de vies ont pu être perdues à cause de ce que les auteurs de l’étude ont appelé un «biais racial dans un algorithme»?

Que pouvons-nous faire pour lutter contre ce parti pris? J’ai appris que j’utilisais un algorithme incorrect parce que j’ai visualisé mes données, vu que les prédictions de mon algorithme n’étaient pas alignées avec ce que mes données ou mes recherches précédentes ont dit, et ne pouvais pas supprimer l’écart, quelle que soit la façon dont j’ai changé mon algorithme. De même, pour lutter contre tout biais, les idées politiques doivent se concentrer sur les algorithmes et les données.

Pour résoudre les problèmes liés à l’algorithme, nous pouvons promouvoir la transparence des algorithmes, où tout le monde pourrait voir comment fonctionne un algorithme et apporter des améliorations. Étant donné que la plupart des algorithmes d’apprentissage automatique commerciaux sont considérés comme des informations propriétaires, les entreprises peuvent ne pas être disposées à partager leurs algorithmes.

Une voie plus pratique pourrait être de tester occasionnellement des algorithmes pour détecter les biais et la discrimination potentiels. Les entreprises elles-mêmes pourraient effectuer ces tests, comme l’exigerait la loi sur la responsabilité des algorithmes de la Chambre des représentants, ou les tests pourraient être effectués par un organisme d’accréditation indépendant à but non lucratif, tel que le Forum proposé pour la régularisation de l’intelligence artificielle (FAIR).

Pour s’assurer que le test est juste, les données elles-mêmes doivent être justes. Par exemple, les algorithmes de prévision de la criminalité analysent les données historiques sur la criminalité, dans lesquelles les personnes appartenant à des groupes raciaux et ethniques minoritaires sont surreprésentées, et donc l’algorithme peut faire des prédictions biaisées même si l’algorithme est construit correctement. Par conséquent, nous devons nous assurer que des ensembles de données représentatifs sont disponibles pour les tests.

Il ne sera pas facile d’obtenir ces changements. Alors que l’apprentissage automatique et l’intelligence artificielle deviennent plus essentiels à nos vies, nous devons veiller à ce que nos lois et réglementations suivent le rythme. L’apprentissage automatique révolutionne déjà des industries entières, et nous n’en sommes qu’au début de cette révolution. En tant que citoyens, nous devons tenir les développeurs d’algorithmes et les utilisateurs responsables pour veiller à ce que les avantages du machine learning soient équitablement répartis. En prenant les précautions appropriées, nous pouvons nous assurer que le biais algorithmique est un bogue et non une caractéristique des futurs algorithmes.