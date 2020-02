Quand j’étais au lycée, Leticia Martín-Fuentes était convaincue qu’elle voulait étudier l’informatique. Il a choisi le baccalauréat technologique et, avant d’entrer à l’université, a pris un virage à 180 degrés et a commencé à étudier la philologie classique. “Avec votre intelligence, comment allez-vous étudier cela?”, lui ont-ils dit. Mais Leticia a continué et, pendant la course, a découvert un secteur qui semblait fait pour elle. Il a mélangé les deux choses qu’il aimait, la linguistique et l’informatique. C’était le début de ce qu’il finirait par dédier, même si c’était quelque chose presque inconnu de beaucoup de gens: linguistique informatique. Maintenant, travaillez chez Google pour apprendre aux assistants vocaux à parler et à comprendre notre langue.

Ce travail est l’une des branches les plus connues et naissantes du secteur en raison de la montée des assistants vocaux. Lorsque nous disons des phrases comme «OK Google, allume les lumières», l’appareil nous comprend parfaitement et exécute ce que nous demandons. Mais Comment enseignez-vous aux participants comme Alexa, Siri ou Google Assistant?

«Une partie de notre travail est que la machine nous comprend lorsque nous lui parlons. Cela peut, à partir de ce que vous dites, le lier à ce que nous appelons une intention, qui est une intention de l’utilisateur, ce que vous voulez faire », a-t-il expliqué dans une interview à Hipertextual.

L’assistant vocal doit être capable de comprendre l’utilisateur

De nouvelles intentions sont ajoutées chaque jour pour localiser les besoins des utilisateurs et les rapprocher de plus en plus de la vie quotidienne de toute personne. Un exemple de ces intentions peut être «Éteindre les lumières». Bien que la plupart des intentions des utilisateurs soient déjà enregistrées et que de nouvelles soient ajoutées chaque jour, des défis subsistent. Parlez à un assistant vocal ce n’est pas comme avoir une conversation entre les gens, malgré le fait que la technologie progresse chaque jour dans ce secteur.

S’il y a un malentendu et une ambiguïté dans une conversation, avec un assistant vocal n’est pas différent. “Si nous voulons vous demander de payer la facture d’électricité et que nous disons” Nous allons payer la lumière “, vous comprenez sûrement” payer la lumière “, a expliqué Martín-Fuentes. Un jargon différent peut également être difficile en fonction du pays hispanophone dans lequel l’utilisateur se trouve. Un réfrigérateur n’est pas la même chose qu’un réfrigérateur, surtout si vous êtes en Espagne ou au Mexique. Par conséquent, les linguistes computationnels doivent anticiper et enseigner à la machine toutes les synonymes possibles du même mot, même avec le risque qu’un terme soit trop ambigu.

Cependant, les entreprises ont réussi à améliorer l’identification des différents accents et l’aide qui ne devient pas un problème pour l’utilisateur. A propos, Linguistes d’Alexa, l’assistant vocal d’Amazon, a expliqué à Hypertextual que les habitants de Londres prononcent les mots d’une manière très différente de celle de Glasgow, et il en va de même en Espagne. «Nous avions besoin d’Alexa pour pouvoir comprendre un grand nombre d’accents dans toute l’Espagne. Un client de Cordoue prononcera les choses très différemment d’un client de Saint Jacques de Compostelle. L’équipe a travaillé extrêmement dur pour améliorer leur compréhension. »

Mais Qu’est-ce qui se cache derrière ces réalisations?

La linguistique informatique est l’un des éléments clés qui contribuent au développement de l’intelligence artificielle, qui a longtemps été cessé de faire partie de la science-fiction pour devenir une technologie au quotidien. Ces systèmes fonctionnent en analysant de grandes quantités de données, dont ils extraient des modèles qui leur permettent de prendre les décisions pour lesquelles ils ont été programmés. Lorena Fernández, ingénieure et directrice de l’identité numérique à l’Université de Deusto (Bilbao), y pense comme s’ils étaient étudiants.

Ils apprennent les informations contenues dans le manuel qui leur est remis, mais les enseignants sont également importants, ce qui leur indique ce qui entre dans l’examen et quels paramètres sont importants. »

Cette comparaison révèle les clés de l’apprentissage que les machines effectuent, dans lesquelles les informations avec lesquelles elles s’entraînent et la définition des paramètres les plus importants façonnent une manière concrète de «penser». Mais bien qu’il puisse sembler que ce soit un processus infaillible, où il n’y a pas de place pour les erreurs, ce n’est pas le cas.

«Je comprends moins les femmes»

Après deux ans de vie en Australie, Louise Kennedy a décidé de franchir le pas et de finalement demander la résidence permanente dans le pays qui, à cette époque, lui avait permis de se consacrer au travail de ses rêves: vétérinaire équin. Pour être admissible à ce type de visa, Louise a dû passer un test de niveau d’anglais, ce qui, en principe, n’allait pas être un problème pour une Irlandaise avec deux titres obtenus en anglais comme elle. Ou alors j’ai pensé.

Après avoir prouvé sans difficulté ses capacités de lecture et d’écriture, la jeune vétérinaire n’a pas atteint le score requis par le gouvernement dans le test de maîtrise orale, obtenant 74 des 79 points nécessaires pour réussir l’examen. Mais pourquoi Louise n’a-t-elle pas pu convaincre les autorités compétentes de sa capacité à parler correctement sa propre langue?

Louise s’est vu refuser un visa en raison de la reconnaissance vocale

Pour effectuer son examen, Louise a fait confiance Pearson, l’une des cinq entreprises officiellement accréditées pour effectuer les tests d’accès au visa permanent, mais la seule qui utilise un logiciel de reconnaissance vocale pour l’examen oral. Le problème est que le logiciel reconnaître plus facilement la voix masculine que le féminin Un parti pris technologique évident qui a coûté à Louise la possibilité d’accéder à la résidence permanente en Australie, la forçant à demander un autre visa plus cher pour pouvoir rester dans le pays avec son mari et son fils.

Les intelligences artificielles développent leurs paramètres normaux à partir des données qu’elles obtiennent de la société, ce qui conduit nécessairement à reproduction de leurs préjugés et inclinations, à moins qu’un effort délibéré ne soit fait pour les corriger. Lorena Fernández estime que “la raison sous-jacente de tout cela est que les bases de données contiennent plus de données masculines blanches et moins de données vocales féminines ou minoritaires”. Déclare que c’est une erreur d’accorder à la technologie «cette aura de neutralité avec lequel il semble qu’ils vont prendre de meilleures décisions qu’une personne, croire qu’ils ne vont pas encourir d’intentions ou de préjugés ».

Il est clair que la technologie n’est pas complètement neutre mais Est-il logique que les machines le soient? Aurora Martínez Rey, docteur en technologie de l’information, soutient que “développer une technologie” intelligente “pour qu’elle n’agisse pas lorsqu’elle a été programmée pour elle, n’a aucun sens.” Pour sa part, Fernández affirme qu ‘”il n’y a pas de neutralité”, mais qu’en tout état de cause, elle doit être différenciée entre intentionnel et involontaire. La présence de biais involontaires dans la technologie est plus courante que nous l’imaginons et parfois, comme celle de Louise, les conséquences de ces les échecs peuvent aller au-delà d’un malentendu avec Siri.

Luke Porter / Unsplash

Si, comme dans les manuels des écoles mentionnés par Fernández, les bases de données sont remplies de voix masculines, mais elles ont peu d’exemples de voix de femmes, l’algorithme d’apprentissage sera mieux formé pour reconnaître et comprendre les voix des premiers que celles des seconds. Afin d’atténuer les biais des assistants vocaux et de l’intelligence artificielle en général, il est essentiel d’intégrer la diversité dès le début. “Le mot clé ici est l’intersectionnalité”, explique Fernández. Quelque chose qui implique d’avoir des bases de données qui reflètent la diversité sociale du genre, de la race, de la classe, etc., mais qui déterminent également correctement les paramètres importants pour la prise de décision.

Le langage définit notre façon de penser et constitue le ticket qui nous permet d’entrer dans la société par la communication. Pour Carolina Arrieta, docteur en linguistique appliquée et professeur à l’UDIMA, “le langage est le témoignage de la société et a en même temps un impact sur elle”, il est donc nécessaire que les machines apprennent à communiquer le plus complètement possible. Compte tenu de la neutralité de la grammaire, pour Arrieta, l’important “est l’incidence de la langue dans la société et de la société dans la langue”, c’est-à-dire la l’impact que la langue a sur les gens. En plus de l’inclusion de la diversité, elle s’engage à «ne jamais oublier le travail humain, qui est essentiel pour aider les machines à interpréter les données».

La fille d’Australie a été l’une des victimes de machines asymétriques et limitées. Bien que nous ayons précédemment commenté l’avis de l’un des experts sur la fausse neutralité, certains techniciens ont pris des mesures pour s’assurer que la langue des assistants vocaux ne soit pas marquée par un genre spécifique. Dans le cas de Google, les linguistes informaticiens ont le directive spécifique de ne pas s’adresser à l’utilisateur en tant qu’homme ou en tant que femme. “Au lieu de” Bienvenue “, nous essayons de renverser la situation et de dire” Je vous souhaite la bienvenue. “Cela est fait de manière à ce qu’aucun sexe ne soit supposé”, a déclaré Leticia Martín-Fuentes.

L’employée de Google a ajouté qu’elle était en faveur de solutions telles que l’inclusion d’un “e” dans le vocabulaire afin de ne pas définir le sexe de la personne. À l’avenir, si les gens l’utilisent de plus en plus, at-il poursuivi, il peut se propager et que la grammaire peut être changée, bien que pour l’instant ce soit encore une langue de niche.

L’Assistant Google utilise un langage sans genre

À cet égard, Carmen Torrijos, linguiste à l’Institute of Knowledge Engineering (IIC), a rapporté que chaque ensemble de mots enseignés à une machine – appelé “corpus” – est examiné par plusieurs personnes. Par conséquent, il doit y avoir un consensus sur le contenu à enseigner. “Nous voulons qu’il apprenne bien et pas que l’apprentissage biaisé sinon, les résultats seront également biaisés. C’est pourquoi nous sommes très prudents avec ce que nous introduisons dans les modèles, afin qu’il soit représentatif, général et qu’il y ait un consensus sur ce qui est appris, d’avoir un modèle qui ne sera pas universel », a-t-il déclaré lors d’un entretien avec Hypertext dans les bureaux de la IIC

Par conséquent, il a ajouté que le jour viendra peut-être où vous devrez inclure une langue beaucoup plus inclusive même si, d’ici là, il devrait y avoir un consensus beaucoup plus grand au niveau social.

L’espagnol, comme le dictent les chanoines

Mais le débat ne s’arrête pas là. Faut-il enseigner l’espagnol aux machines selon le SAR ou aussi une forme plus familière et généralement plus utilisée?

Les experts consultés par Hypertextual ont convenu que, dans la majorité, ils enseignent aux machines un langage aussi neutre que possible. En premier lieu, parce que cette décision est conforme à l’objectif d’un assistant vocal et, selon les mots de Martín-Fuentes, il n’est pas recommandé que sa façon de parler attire beaucoup l’attention car elle pourrait induire l’utilisateur en erreur. Pour sa part, Luis Alfonso Ureña, expert en langages et systèmes informatiques à l’Université de Jaén, a préconisé de faire utilisation correcte de la langue. “Si nous faisons de mauvaises productions d’un terme et que nous les assumons dans des systèmes de ce type, nous pouvons répandre une mauvaise utilisation des tours et des expressions”, a-t-il déclaré dans une interview.

Jonas Leupe / Unsplash

Selon Lorena Fernández, ce sont “ces logiciels ceux qui doivent être au service de la société et c’est la société qui doit être la source de l’apprentissage “, même s’il insiste pour que cela se fasse sans négliger les règles de grammaire. D’autre part, Carolina Arrieta soutient que” le contexte est tout “. Pour elle, la grammaire doit être apprise avec précision, mais le plan lexical admet une plus grande souplesse. “Le SAR n’est pas prescriptif, (…) c’est un registre de la langue espagnole” et les machines doivent connaître les usages sociaux de la langue, même s’ils sont incorrects ou discriminatoire. “Ils devraient savoir, mais ils doivent savoir que leur utilisation est socialement pénalisée.”

Pour le SAR, ce débat n’est pas inconnu et a décidé prenez vos propres mesures encourager une bonne utilisation de la langue. Fin 2019, il a promu, avec Telefónica, le projet d’espagnol et d’intelligence artificielle (LEIA) s’est concentré sur le domaine de l’intelligence artificielle et des technologies actuelles.

Des entreprises telles que Google, Amazon, Microsoft, Twitter et Facebook collaborent au projet. Les partenaires technologiques ont également signé un déclaration d’intention grâce à laquelle ils se sont engagés à utiliser des documents RAE tels que leurs dictionnaires, grammaire ou orthographe dans le développement de leurs assistants vocaux, chatbots et autres ressources, selon les informations fournies par Telefónica.

“Un service est rendu au public et c’est pourquoi il est pris en compte qu’aucune erreur n’est commise et qu’il n’y a pas d’argot concret, car sur le plan social vous avez un engagement“, a expliqué Nerea Suárez, linguiste informatique dans le domaine de l’intelligence artificielle d’Aura, assistant vocal de Telefónica.

Dans Google, ils ont atteint ce que certains pourraient considérer comme un terrain d’entente. Il consiste à enseigner aux assistants vocaux à parler dans un espagnol «neutre» et «formel» mais, au contraire, les linguistes sont commencer à enseigner toutes sortes de vocabulaire afin qu’ils puissent également comprendre une langue plus familière. Par exemple, certains utilisateurs établissent des routines de sorte que lorsqu’ils disent “Bonjour” ou “Bonne nuit”, l’assistant règle des alarmes ou fournit des informations sur l’heure, l’heure, etc. Au lieu de “Bonsoir”, l’assistant pourrait également comprendre d’autres expressions telles que “Je vais à l’enveloppe”. Bien que les assistants vocaux commencent à apprendre un langage plus familier, ces pratiques ne sont pas répandues dans toutes les entreprises technologiques.

Le SAR a mis en place plusieurs mécanismes pour encourager une bonne utilisation du langage dans les nouvelles technologies

Ce que certains ont essayé en tant qu’Amazon, c’est d’essayer Alexa parle comme si elle venait d’Espagne. “Nous avons travaillé dur pour la former à la phonétique régionale afin qu’elle puisse prononcer avec précision les noms de lieux, de personnes et d’événements importants dans toutes les régions du pays”, a expliqué les porte-parole de l’assistante.

Un exemple de phonétique est, par exemple, la manière dont les Espagnols prononcent l’anglais. Si nous demandons à Alexa de nous jouer une chanson de notre playlist dont le titre est en anglais, vous aurez besoin comprendre comment les indigènes prononcent ces chansons et les noms d’artistes étrangers.

Et encore plus: “Alexa a besoin de savoir ce qui compte le plus pour les clients espagnols, et d’avoir le personnalité et connaissance d’un local“Cela signifie connaître vos vacances, vos villes, vos personnages clés, si vous avez des célébrités, des livres, des poèmes préférés.

“Il a un énorme dépôt de blagues ringardes, connaît ses paroles et connaît ses informations sur le football telles que la Liga, la Ligue Europa, la Ligue des Champions et d’autres événements sportifs importants”, a déclaré Amazon à Hipertextual.

Franck V / Unsplash

Les femmes de lettres et les hommes de science?

Un secteur qui rejoint deux races complètement opposées, l’une des lettres, l’autre des sciences. Cela mélange plusieurs techniques de travail et une équipe avec différents profils et connaissances. C’est précisément ce qui n’est pas enseigné dans les écoles et ce qui fait que la plupart des linguistes en informatique commencent, autodidacte. Comme Carmen Torrijos, qui a fait une carrière en sciences humaines et ce n’est que plus tard qu’elle a découvert ce secteur. «Cela n’aide pas que nous ayons un plan national de technologie des langues s’il n’y a pas de plan universitaire qui offre une formation aux informaticiens. Quand j’ai commencé il n’y avait pas de formation formelleet ce n’était pas il y a tant d’années », a-t-il expliqué.

Le même problème se produit en sens inverse car cette alternative n’est pas enseignée aux ingénieurs qui pourraient se spécialiser dans le traitement des langues. Dans toute entreprise spécialisée en linguistique informatique, ces deux profils opposés travaillent ensemble quotidiennement. Torrijos a souligné l’importance du travail d’équipe afin que où l’un n’arrive pas, l’autre ne. Ces équipes sont cependant mixtes, la plupart des linguistes sont des femmes et les ingénieurs sont des hommes. Dans les deux cas, mélanger les connaissances est essentiel, même si ce n’est pas un processus facile.

Bien que nous soyons au 21e siècle, pour certaines personnes les sujets restent les mêmes que celles du siècle dernier. Leticia Martín-Fuentes a dû entendre combien de personnes autour d’elle lui ont dit qu’elle était trop intelligente pour étudier la philologie classique et qu’elle pouvait aspirer à une carrière scientifique. Et, beaucoup d’autres qui ont fini par étudier la même chose que Martín-Fuentes, ont dû plus tard s’intégrer dans un monde complètement technologique et, surtout, des hommes.

Parfois, vous devenez complexe parce que vous ne savez rien, mais ce n’est pas vous, c’est très difficile. Vous n’avez aucune formation et apprenez de l’intérieur », a expliqué Torrijos.

Au-delà du choc culturel qu’un humaniste subit lorsqu’il entre dans un monde technologique, la linguistique de l’IIC a apprécié qu’au final c’est une situation qui vous enrichit car les choses sont vues d’une manière différente.

Certaines personnes peuvent penser que les linguistes informaticiens sont une carrière peu connue. Mais c’est là pour rester. À une époque où les réalisations technologiques sont à l’ordre du jour et où la communication avec les machines, notamment avec les assistants vocaux, fait de plus en plus partie de notre quotidien, ce secteur est l’un des plus innovants. et prometteur.

En ce sens, Antonio Rodríguez de las Heras, professeur à l’Université Carlos III de Madrid et directeur honoraire de l’Institut de Culture et Technologie de cette université, voit la technologie comme une opportunité pour transcender notre moi actuel. “L’être humain laisse ses capacités naturelles dans ses créations artificielles.” Selon lui, «l’artefact amplifie cette capacité versée dans l’artificiel». Ce que nous transmettons aux machines, après tout, n’est rien d’autre que notre héritage. Cependant, en eux, nous avons également la capacité de nous corriger. “[Las máquinas] ils apparaissent devant nous comme des miroirs, certes flous, mais dans lequel nous pouvons nous reconnaître», Et cette reconnaissance nous amènera à reconsidérer nos valeurs et les parties de nous que nous voulons véhiculer.

«Arrivant aujourd’hui au seuil de créations artificielles aussi puissantes que l’intelligence artificielle, nous sommes confrontés à un défi qui dépasse de loin tout autre auquel les artefacts ont adressé leurs créateurs, (…) nous sommes confrontés au défi de décider comment nous voulons être. La question est, Allons-nous manquer cette opportunité?