L’espace de test personnalisé pour les enceintes intelligentes.

La capacité d’écoute d’assistants numériques comme Alexa et Siri est devenue un point de blocage majeur en matière de confidentialité au cours de la dernière année. Un groupe de chercheurs de la Northeastern University et de l’Imperial University of London étudie les haut-parleurs intelligents depuis six mois pour en savoir plus sur ce qui les déclenche et s’ils “écoutent” tout le temps.

L’étude en cours n’a trouvé «aucune preuve à l’appui» de la possibilité que les assistants numériques écoutent toujours. Les appareils ont été activés souvent dans l’étude, principalement par des mots qui ressemblent aux phrases destinées à les réveiller – pour Alexa, les exemples incluent des mots avec des sons «k» tels que «exclamation», «voiture de kevin» et «congresswoman» – mais ils ne restent allumés que pendant de courts intervalles de quelques secondes à près d’une minute.

Les chercheurs ont installé plusieurs haut-parleurs intelligents – quelques Echos, un Google Home Mini, un Apple HomePod et un Harman Kardon Invoke propulsé par Microsoft Cortana – et ont construit une zone où ils pouvaient surveiller et enregistrer quand et comment ils étaient activés. L’équipe a joué 125 heures d’émissions sur Netflix avec des dialogues intenses, y compris The Office, Gilmore Girls et Grey’s Anatomy et a enregistré quelles phrases – en dehors des «mots de réveil» traditionnels – activaient les appareils.

L’étude a révélé que l’Echo Dot 2nd Generation et l’Invoke restaient éveillés le plus longtemps, entre 20 et 43 secondes. Le reste des appareils avait une période d’activation plus courte, avec près de la moitié d’entre eux durant 6 secondes ou moins.

Bien que les mots qui sonnaient comme les phrases de réveil déclenchent des appareils, il était difficile d’obtenir des résultats répétés. L’équipe a répété ses expériences 12 fois, et seulement 8,44% des activations se sont produites de manière cohérente.

Dave Limp, vice-président senior des appareils et services d’Amazon, s’exprimant lors du sommet . 2019. (Photo . / Dan DeLong)

La définition de «l’écoute» dans ce contexte peut prêter à confusion, même pour les personnes qui fabriquent les appareils. Interrogé sur un épisode de PBS Frontline la semaine dernière, le chef des appareils d’Amazon, Dave Limp, a été interrogé sur la façon dont Amazon pouvait convaincre des millions de personnes d’installer des «appareils d’écoute» chez eux. Limp a semblé faire un faux pas en répondant à la question, insistant sur le fait qu’Alexa n’est pas un appareil d’écoute, avant de décrire comment il «écoute», puis revient en arrière.

«Je serais d’abord en désaccord avec la prémisse. Ce n’est pas un appareil d’écoute », a déclaré Limp. «L’appareil dans son cœur est doté d’un détecteur – nous l’appelons en interne un« moteur de mots de réveil »- et ce détecteur écoute – pas vraiment, il détecte une chose et une seule chose, c’est le mot que vous avez dit que vous voulez attirer l’attention de cet écho. “

La question de savoir comment ces assistants virtuels surveillent les mots de veille deviendra encore plus importante à mesure qu’ils se propageront à différents types d’appareils Internet des objets, tels qu’une bague intelligente et des lunettes compatibles Alexa dévoilées par Amazon l’année dernière.

Tout au long de 2019, des rapports ont révélé que des équipes d’employés de géants de la technologie tels que Google, Amazon, Apple et bien d’autres écoutaient des clips audio d’énoncés faits à leurs haut-parleurs intelligents pour améliorer les assistants numériques. En raison de problèmes de confidentialité, les sociétés ont commencé à autoriser les utilisateurs à refuser la révision de leurs clips audio.

Le rapport n’est que la première étape d’un projet plus vaste. Les futures mises à jour examineront le nombre d’activations conduisant à des enregistrements audio envoyés vers le cloud par rapport à traités uniquement sur l’appareil; si les fournisseurs de cloud affichent avec précision tous les cas d’audio enregistré; si les haut-parleurs s’adaptent et s’adaptent à ce qu’ils ont entendu; et comment le sexe, l’origine ethnique, l’accent et d’autres facteurs affectent les activations des locuteurs.