Google recueille de grandes quantités de données vocales sur tous ses produits, et bien qu’il n’ait pas été trop transparent sur la pratique, nous en tant qu’utilisateurs en profitons pour la plupart. La reconnaissance vocale s’est constamment améliorée au fil des ans, ce qui a permis à une technologie de science-fiction impressionnante comme des haut-parleurs intelligents d’entrer dans nos maisons. Il y a un département où Google doit intensifier son jeu: les locuteurs multilingues ont du mal à utiliser plus d’une langue sur n’importe quel produit Google.

Bien qu’il y ait beaucoup de gens qui vivent toute leur vie en ne parlant qu’une seule langue, de nombreux pays du monde jonglent régulièrement entre deux ou même plus tout le temps. De nos jours, de nombreux produits sont encore développés par des personnes n’ayant qu’une seule langue principale, donc le support bilingue n’est souvent pas aussi bon qu’il pourrait l’être (ce qui est également vrai en dehors du traitement de la parole et de l’audio).

C’est un problème pour les personnes qui passent régulièrement de plusieurs langues. Le fondateur d’Android Police, Artem, se débat régulièrement avec la fonction de dictée de Gboard tandis que notre rédactrice Rita vient tout juste de retirer sa langue secondaire, le français, d’Assistant. Il existe également des rapports sur Reddit se plaignant de problèmes découlant d’un assistant bilingue. Certains rédacteurs ont même remarqué que leurs haut-parleurs Google Home ont besoin de plus de temps de traitement lorsqu’ils doivent jongler avec deux langues.

… Ce que j’ai dit en gros, en anglais: “Les dates de publication originales seront publiées plus tard ce mois-ci.”

Ce que @google a transcrit: “Ураган тяжелый из галогенов по СТС для Smart TV.”

C’est un non-sens complet, et cela arrive tout le temps.

– Artem Russakovskii (@ArtemR) 2 janvier 2020

Gboard

Voici quelques exemples des malheurs bilingues de Gboard pour moi, un locuteur natif allemand. Ces problèmes seraient certainement amplifiés pour les personnes utilisant plus de deux langues.

Comme vous pouvez l’entendre et le voir, il y a aussi des cas où Google change arbitrairement de langue au milieu d’une phrase pendant le traitement. Cela a parfois du sens (je change de langue au milieu de la phrase selon qui je parle), mais cela arrive souvent quand ce n’est pas censé se produire. C’est le cas dans ces exemples, où Google a complètement manqué que je parlais anglais et a créé du charabia allemand non-sens, traduit pour votre commodité:

“Je vais maintenant montrer à quel point[ly] Google me comprend “->” Arena Damen straight Herbert Google landesgrenzen “->” Arena ladies straight Herbert Google frontières ”

“Si seulement il y avait un moyen d’automatiser cela” -> “BVG ticketautomat” -> “BVG vending machine” (BVG est l’agence de transport public ici à Berlin, donc cette combinaison est étonnamment logique.)

“Attendez, je dois encore terminer l’article” -> “AUTOMEISTER Haftbefehl nicht radeke” -> “Le mandat d’arrêt de CARMASTER n’est pas radeke” (ce dernier mot n’est même pas un mot en allemand, et je ne sais pas pourquoi CARMASTER apparaître dans toutes les majuscules.)

Notez qu’il a fallu quelques essais pour éliminer ce niveau de malentendu de Gboard et dans les extraits que vous entendez ici, mon accent est le plus visible, ce qui pourrait amplifier le problème. Pourtant, Gboard devrait être capable de remarquer que ce qu’il produit en allemand est du charabia pur et passer à l’anglais à la place.

Assistant Google

L’assistant ne fonctionne pas correctement lorsque vous le définissez sur deux langues. Commençons par un classique dont j’entends parler tous les deux jours lorsque j’essaie de régler une minuterie en anglais, enregistrée par mes appareils Google Home:

https://www.androidpolice.com/wp-content/uploads/2020/01/timer-for-5-recording.mp3

J’ai dit à Google de “régler une minuterie pendant 5 minutes”. Pour une raison quelconque, Google a alors décidé de comprendre la première partie en allemand: “Stelle Timer” au lieu de “régler une minuterie”. L’assistant a obtenu le reste de la phrase en anglais, il a donc décidé que “pendant cinq minutes” devait être le nom de la minuterie (comme dans “Réglez une minuterie appelée” frites “”) et m’a demandé combien de temps cela devait être. C’est à ce moment-là que je dois répondre en allemand et lui dire de régler une minuterie pour cinq minutes, encore une fois. La réponse, entièrement traduite: “Bien sûr, minuterie de cinq minutes appelée” pendant cinq minutes “. À partir de maintenant.” ¯ _ (ツ) _ / ¯

https://www.androidpolice.com/wp-content/uploads/2020/01/turn-off-the-lights-recording.mp3

Traduction de la phrase absurde allemande ci-dessus: “Minuterie pour déjà.” Ce que j’ai dit: “Éteins les lumières.”

De temps en temps, Google aime comprendre quelque chose de complètement différent. Quand j’ai dit “éteignez les lumières”, j’ai pensé que je voulais régler une “minuterie pour déjà” en allemand, une phrase qui n’a aucun sens.

Ces problèmes ne se posent pas uniquement aux personnes aux accents épais. Artem n’a pas du tout d’accent, et Google pense toujours que je parle anglais lorsque je m’adresse à lui en allemand (sans accent). Il en va de même pour Rita avec sa combinaison d’assistant anglais / français. Cela nous arrive toujours au point où il est plus pratique de désactiver complètement l’une des langues.

Solutions possibles

Sur Gboard, cela aiderait déjà s’il y avait un moyen rapide et facile de pousser Google à retranscrire ce que vous venez de dire – peut-être un menu à longue pression qui vous permet de choisir la langue que le clavier devrait réessayer?

Quant aux haut-parleurs intelligents, c’est un peu plus difficile mais certainement faisable. Pourquoi ne puis-je pas suivre une commande mal interprétée et mal traduite en disant: “Hé Google, c’était allemand, essayez encore?” Cette approche est encore insuffisante pour les ménages multilingues qui utilisent trois langues et argots différents en une phrase, mais ce n’est pas quelque chose que j’attendrais raisonnablement pour le moment compte tenu des malheurs bilingues avec lesquels nous vivons.

Google pourrait également utiliser une combinaison de données de localisation et d’historique de navigation pour évaluer ma langue maternelle. Ensuite, il pourrait s’attendre à ce que mon anglais sonne un peu plus allemand et développe une certaine tolérance aux erreurs ou aux prononciations inhabituelles. Bien sûr, cela pourrait fonctionner pour toute autre combinaison de langues. Mais c’est une solution de niveau supérieur, et je pense que c’est plus avancé et plus difficile à mettre en œuvre que d’autres approches.

Les langues sont difficiles, et nous devons nous rappeler que nous ne finissons pas non plus par nous comprendre dans notre vie quotidienne. J’ai l’impression que nous attendons trop de perfection de nos machines. Cependant, ce qui manque aux algorithmes est un moyen d’exclure rapidement les faux positifs et de comprendre l’intention.

Si je devais dire à une personne de régler une minuterie pendant que je cuisine et que cette personne devait décider si je disais «10 minutes» ou «10 heures», elle opterait très probablement pour des minutes compte tenu du contexte. La même chose est vraie dans toutes les langues. Si je ne comprends que le charabia parce que je suis à l’écoute de l’anglais à un moment donné (croyez-moi, cela arrive), je m’arrête et j’essaie de parcourir ce que j’ai entendu juste pour réaliser que c’était en fait l’allemand.

Pour les machines, ce n’est probablement pas un exploit facile, mais Google a déjà réussi à isoler une seule voix dans une foule dans une démonstration technologique de deux ans, il semble donc étrange que le support multilingue soit toujours aussi médiocre.

Nous devons cependant attribuer à Google le mérite qui lui revient: Amazon n’a introduit le support bilingue dans Alexa qu’en octobre 2019, tandis que Siri ne prend pas en charge plus d’une langue à la fois. Cela me donne l’espoir que Google vient d’être si tôt dans le jeu (vous vous souvenez de Google Now?) Qu’il y a beaucoup de place pour une amélioration future. Google est également un pionnier des traductions accessibles à l’utilisateur à la volée via l’Assistant et les traductions instantanées par caméra, il est donc clair que la société reconnaît l’importance de ce domaine.

En attendant, j’ai désactivé l’allemand sur mon assistant, et à part les difficultés avec les adresses et les chansons locales, l’expérience est tellement meilleure maintenant.