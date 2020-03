Près d’une semaine avant que l’Organisation mondiale de la santé ne signale pour la première fois une mystérieuse nouvelle maladie respiratoire à Wuhan, en Chine, une équipe de détectives basés à Boston du système mondial de surveillance des maladies HealthMap a capturé des indices numériques sur l’épidémie dans un rapport de presse en ligne. Le même jour, le 30 décembre, ProMED, un autre groupe de détection numérique des maladies, a pris connaissance d’un bavardage en ligne sur une pneumonie d’origine inconnue sur le site de micro-blogging chinois Weibo. Comme les chercheurs l’ont rapporté plus tard, les nouveaux mots clés populaires sur la plate-forme de médias sociaux WeChat incluaient «SRAS», «essoufflement» et «diarrhée».

De telles alertes révèlent la promesse d’une ressource vaste mais risquée: les indices de la taille d’un tweet de personnes du monde entier qui signalent leur état de santé et expriment leurs craintes en ligne. Certains chercheurs demandent aux responsables de la santé publique de tirer davantage parti de ce coffre virtuel de données, en particulier compte tenu de la propagation rapide actuelle du nouveau coronavirus.

«Nous sommes au bord d’une opportunité sans précédent pour suivre, prédire et prévenir les fardeaux mondiaux des maladies dans la population à l’aide de données numériques», Allison Aiello, épidémiologiste à la Gillings School of Global Public Health de l’Université de Caroline du Nord, et deux diplômés les étudiants écrivent dans le 2020 Revue annuelle de santé publique.

“Il y a des quantités incroyables de données sur les blogs des médias sociaux, les salons de discussion et les reportages locaux qui nous donnent des indices sur les épidémies qui se produisent quotidiennement”, a récemment déclaré John Brownstein, directeur de l’innovation au Boston Children’s Hospital et à la Harvard Medical School, à . Headline News. . De telles données, que Brownstein appelle «chapelure numérique», sont une matière première vitale pour un nouveau domaine d’investigation connu sous le nom d’épidémiologie numérique. HealthMap, qu’il a cofondé en 2006, est l’un des principaux efforts dans ce domaine.

Le premier grand succès de HealthMap est survenu lors de la pandémie de grippe H1N1 (grippe porcine) en 2009, lorsqu’il a utilisé des sources qui incluaient des reportages en ligne en espagnol pour aider à détecter rapidement une maladie respiratoire non identifiée à Veracruz, au Mexique. Cinq ans plus tard, il a exploité le fil Twitter de l’OMS et d’autres sources pour suivre la propagation du virus Ebola, qui a finalement tué plus de 11 000 personnes en Afrique de l’Ouest.

L’Organisation mondiale de la santé utilise désormais régulièrement HealthMap, ProMED et des systèmes similaires pour surveiller les flambées de maladies infectieuses et informer les cliniciens, les responsables et le public. Pourtant, la détection des maladies liées aux mégadonnées en est encore à ses balbutiements par rapport aux méthodes traditionnelles, et Les ingrédients des médias sociaux, en particulier, n’ont pas encore apporté de contribution majeure pour prédire où et comment les maladies infectieuses peuvent frapper.

Jusqu’à présent au moins, HealthMap ne dépend toujours pas fortement des médias sociaux; au lieu de cela, il suit principalement les rapports des sources d’information en ligne et des gouvernements, tout en incluant certains messages sur les réseaux sociaux de professionnels de la santé publique. De plus, HealthMap appelle les bénévoles à soumettre des données hebdomadaires à sa plateforme de suivi des maladies participative, la grippe près de chez vous. Fin mars, il a lancé un nouveau site, Covid Near You, qui se concentre spécifiquement sur les symptômes et les tests de Covid-19.

Pourtant, selon Brownstein et d’autres experts, les deux principaux avantages de l’épidémiologie numérique – la vitesse et le volume – peuvent de plus en plus aider les responsables de la santé à détecter les épidémies rapidement et à moindre coût. Dans le même temps, l’énorme volume de données numériques provenant des médias sociaux s’accompagne également de défis suffisants en matière de précision et de confidentialité pour en faire une «arme à double tranchant», selon les mots de la chercheuse en université de l’Université College de Londres Patty Kostkova. C’est une histoire désormais familière: les progrès technologiques dépassent notre capacité à garantir leur qualité et leur sécurité.

Le défi le plus immédiat est de bien faire les choses. «Il est en fait très difficile d’obtenir des données prospectives utiles à partir des médias sociaux», explique Clark Freifeld, informaticien de la Northeastern University, qui a cofondé HealthMap avec Brownstein. L’un des plus grands défis, dit-il, est qu’une fois qu’une maladie devient une nouvelle, la plupart des requêtes et messages des médias ultérieurs sont des réactions à ces nouvelles plutôt que des indicateurs de nouvelles nouvelles à venir.

Par exemple, en 2012, Google Flu Trends a estimé une forte augmentation du nombre de cas de grippe hivernale sur la base d’une utilisation accrue de termes liés à la grippe dans les recherches Google. Le pic réel s’est avéré être environ deux fois plus élevé, peut-être parce que les recherches des utilisateurs reflétaient des nouvelles d’épidémies de grippe plutôt que de véritables maladies.

Les harengs rouges sont un autre problème grave. Les chercheurs ont noté un pic en 2007 dans les recherches Google pour le mot «choléra». Mais la cause n’était pas une épidémie; au lieu de cela, il s’est avéré qu’Oprah Winfrey avait choisi le roman «L’amour au temps du choléra» pour son club de lecture. Bien que ce cas particulier n’ait égaré aucun responsable de la santé publique, dit Aiello, il s’agit d’un exemple frappant de «bruit» réactif et non pertinent.

HealthMap essaie de résoudre ce problème en utilisant l’intelligence artificielle pour filtrer la répétition et les non-pertinence. «Nous avons une base de données de millions d’articles et de contenus concernant les épidémies», explique Freifeld. “Nous allons étiqueter à la main 100 000 exemples d’épidémies réelles et les comparer avec des choses qui ne sont pas liées, comme une” épidémie “de home run à la septième manche. C’est ainsi que le système apprend ce qui est utile et ce qui ne l’est pas. »

Une des principales raisons pour lesquelles le fil d’Ariane numérique peut égarer les experts est qu’ils peuvent manquer une grande partie de la population. Environ 22% des adultes américains utilisent Twitter, mais ce n’est pas un échantillon aléatoire. Les utilisateurs de Twitter aux États-Unis sont principalement plus riches, plus jeunes, mieux éduqués et plus susceptibles d’être démocrates que les autres Américains. De plus, la plupart des utilisateurs de Twitter ne tweetent pas beaucoup: environ 80% des tweets de tous les utilisateurs américains adultes proviennent des 10% les plus prolifiques. Le profil jeune de Twitter est particulièrement problématique compte tenu du fait que les personnes âgées – du moins selon les hypothèses initiales – ont plus de risques de tomber gravement malades. La surveillance de la santé par le biais de tweets pourrait ainsi ignorer les plus vulnérables d’entre nous.

Plus largement, les médias sociaux sont légitimement connus pour propager des mensonges qui, dans le cas des maladies infectieuses, peuvent avoir des conséquences mortelles. Et cela, disent les chercheurs en santé publique, est toujours un danger dans la recherche de signaux au milieu du bruit des médias sociaux. La santé publique dépend de la confiance dans les fonctionnaires, mais cette confiance peut rapidement s’éroder si un gouvernement publie des informations erronées.

En plus de ses problèmes de précision, l’épidémiologie numérique peut accroître les menaces à la vie privée des internautes. Contrairement à l’Europe, les États-Unis n’ont pas de lois radicales pour protéger la vie privée sur les réseaux sociaux. Des plates-formes telles que Google et Facebook attribuent régulièrement des licences aux utilisateurs des informations agrégées aux annonceurs qui peuvent ensuite cibler les emplacements en fonction du contenu de la recherche et des «j’aime». L’utilisation de ces types de données pour la surveillance de la santé pourrait multiplier les risques d’atteintes à la vie privée, explique Freifeld, en particulier lorsque les problèmes de santé publique entrent en conflit avec la confidentialité.

Les défenseurs de la vie privée sonnent déjà l’alarme au sujet des efforts récents de la Maison Blanche et des Centers for Disease Control and Prevention des États-Unis pour étendre leur accès aux données des téléphones portables des Américains afin de suivre leur emplacement pendant l’épidémie. Les autorités fédérales de la santé espèrent intégrer des données agrégées anonymes pour suivre la propagation du virus et vérifier le respect des nouvelles règles de «distanciation sociale».

Le référentiel croissant de données de santé publique en ligne est devenu un peu plus ouvert au public ce mois-ci. Le 17 mars, CrowdTangle, un site de surveillance des médias sociaux récemment acheté par Facebook, a annoncé qu’il avait lancé une nouvelle fonctionnalité pour permettre aux utilisateurs, notamment aux médias, aux responsables de la santé publique et aux chercheurs, de suivre les tendances sociales sur des sites tels que Facebook, Instagram et Reddit. La société a simultanément lancé un centre de diffusion en continu accessible au public, des affichages en temps réel limités d’informations officielles et de publications sur les réseaux sociaux concernant les infections Covid-19 causées par le nouveau coronavirus. Les publications sur les réseaux sociaux ont été supprimées uniquement à partir de comptes publics et non privés.

Les systèmes de notification volontaire peuvent éviter une partie, mais pas la totalité, des biais de l’épidémiologie numérique courante. La grippe près de chez vous, lancée en 2011, utilise un modèle anonyme et participatif pour collecter des données pour les responsables de la santé publique et les chercheurs.

Un projet quelque peu similaire est FoodBorne Chicago, un système de surveillance basé sur Twitter qui surveille les plaintes de maladies d’origine alimentaire. Basé au Chicago Department of Public Health, il suit les tweets à l’aide d’un algorithme d’apprentissage automatique qui identifie les mots clés «poison alimentaire». Lorsque les résidents locaux tapent ces mots, le site tweete un lien avec un formulaire pour fournir des détails, collectant des données qui n’auraient jamais pu être signalées autrement.

Au cours des sept dernières années, le CDC s’est penché sur la détection numérique des maladies en gérant un concours annuel appelé FluSight au cours duquel des chercheurs du monde universitaire et de l’industrie tentent de prévoir le moment et l’intensité de la saison de la grippe. Le CDC oblige les concurrents à utiliser une sorte de données numériques dans leurs projections.

Pendant ce temps, les chercheurs sont de plus en plus enthousiasmés par le potentiel d’inclure des données provenant de mesures plus directes du bien-être et de la maladie. Des moniteurs intelligents et portables de suivi de la santé fournissent un flux constant de données sur la fréquence cardiaque, les mesures prises et la qualité du sommeil.

Le 25 mars, l’épidémiologiste du Scripps Research Translational Institute, Jennifer Radin, l’auteur principal d’une étude récente sur le rôle potentiellement «vital» des Fitbits dans la détection des maladies, a appelé des volontaires adultes américains à utiliser n’importe quel type de montre intelligente ou de suivi d’activité pour partager leurs données de santé. avec les chercheurs en téléchargeant l’application mobile MyDataHelps. Les chercheurs espèrent utiliser les données pour identifier les changements dans la fréquence cardiaque au repos qui peuvent signifier une maladie, a déclaré Radin à Knowable. Bien qu’elle ait reconnu qu’un rythme cardiaque plus rapide pourrait être induit en regardant simplement les nouvelles, elle a déclaré que les volontaires qui ne se sentent pas bien peuvent également répertorier d’autres symptômes sur l’application.

Au cours des huit dernières années, une startup de San Francisco appelée Kinsa a collecté systématiquement ces données de santé en temps réel, après avoir récemment vendu et donné plus d’un million de thermomètres connectés à Internet. Le scientifique de l’Université de l’Oregon State Benjamin Dalziel, qui collabore à une recherche financée par Kinsa, a déclaré que le système pouvait suivre avec précision la grippe deux semaines avant les prédictions du CDC et pourrait également suivre Covid-19. Le 18 mars, il a commencé à publier de nouvelles données de son système d’adhésion sur des grappes de «fièvres atypiques» sur sa «carte météo santé» sur www.healthweather.us.

Les chefs d’entreprise de Dalziel et de Kinsa sont convaincus que leurs thermomètres peuvent aider pendant cette urgence mondiale. «C’est l’avenir, aussi grand soit-il», déclare Dalziel. «La fièvre est un indicateur clé d’une infection respiratoire aiguë. Il s’agit de mesurer quelque chose de directement lié à la maladie. Et même si je pense qu’il y a eu un travail remarquable pour extraire des informations de Twitter, une lecture de thermomètre a clairement un avantage sur un tweet. »

D’autres experts sont également enthousiasmés par les progrès de Kinsa. «La surveillance de la fièvre est une excellente idée étant donné le manque de kits de test spécifiques à Covid», explique Freifeld de HealthMap.

L’urgence du coronavirus accélère clairement l’intérêt pour l’épidémiologie numérique. Pourtant, à ce jour, Freifeld et d’autres experts conviennent que la promesse du domaine reste davantage un complément qu’un substitut à la surveillance conventionnelle.

Comme Aiello, en Caroline du Nord, reconnaît que pour le moment, au moins: “Nous devrons le valider avec les données traditionnelles du cuir de la chaussure.”

Cet article a été initialement publié dans Knowable Magazine, une entreprise journalistique indépendante des revues annuelles.

.