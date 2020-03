(Graphiques Facteus)

Une entreprise de la région de Portland, en Oregon, avec des données sur des dizaines de millions de transactions par carte de crédit et de débit entrant dans son système chaque jour, a publié un nouveau rapport cette semaine qui révèle un aperçu de la façon dont la pandémie COVID-19 modifie les dépenses de consommation des États-Unis.

Les dépenses en bière, vin et spiritueux ont augmenté de 60% au cours de la semaine du 16 mars par rapport à la même semaine en 2019. À Washington, la taille moyenne des transactions chez Costco a augmenté de 16% dans toutes les données démographiques et de 35% chez les baby-boomers, car l’épidémie s’est intensifiée au cours de la semaine du 9 mars.

Et malgré toutes les nouvelles sur le papier hygiénique et la thésaurisation des désinfectants, il y avait une autre catégorie de produits où les dépenses ont vraiment augmenté: l’alcool (voir ci-dessus).

Autres données: les dépenses de jeux vidéo sont en hausse, tandis que les déplacements et l’hébergement sont en baisse en raison des mesures de distanciation sociale mises en place à travers le pays.

Fondée en 2010, Facteus vient de changer son nom d’ARM Insight. Le changement de nom reflète une évolution progressive de l’entreprise, qui a commencé à se concentrer sur le domaine émergent des données synthétiques.

Les données synthétiques sont exactement ce à quoi elles ressemblent: elles sont fausses. Un nombre croissant d’entreprises de données synthétiques, dont Facteus, utilisent des techniques d’apprentissage automatique pour transformer des informations du monde réel révélant des détails sensibles des transactions bancaires, des réponses aux essais cliniques de médicaments ou des lieux de voyage en de nouvelles versions de données qui, selon eux, ne peuvent pas être retracées à des personnes identifiables. Les controversés Sidewalk Labs d’Alphabet utilisent une approche de données synthétiques.

Facteus a traditionnellement servi des clients bancaires. La société fournit un logiciel d’analyse et aide les clients à monétiser les données de transaction des consommateurs en les transformant en informations qui montrent où les gens ont dépensé avant d’acheter le déjeuner chez Burger King, ou ce qu’ils ont acheté après avoir joué neuf trous de golf, par exemple.

Aujourd’hui, la société se concentre sur la fourniture de services de données synthétiques à ses 1 000 clients, dont beaucoup sont des processeurs de paiement, des fournisseurs de cartes de crédit et de débit, des coopératives de crédit et de grands clients bancaires. Ces entreprises veulent transformer les données de transaction d’achat en quelque chose qu’elles peuvent partager avec des partenaires ou utiliser en interne pour détecter la fraude sans risque d’exposer l’identité personnelle des consommateurs.

PDG de Facteus Randy Koch. (Photo de Facteus)

Une partie de la promesse des données synthétiques est qu’elles offrent une protection de la vie privée qui améliore les méthodes traditionnelles. Les approches de données synthétiques sont particulièrement attrayantes dans les domaines hautement réglementés des données financières, sanitaires et cliniques, où de fausses versions de données réelles peuvent encore satisfaire de nombreux besoins en données.

Les techniques traditionnelles de confidentialité des données prennent des informations brutes comportant des noms, des adresses, des numéros d’identification et d’autres éléments personnellement identifiables et les enlèvent de ces facteurs d’identification. Mais dans de nombreux cas, les méthodes classiques de désidentification ne sont pas à sécurité intrinsèque; les données peuvent être rétroconçues et reliées à des individus.

Ou, dans le cas où les banques utilisent leurs propres données brutes pour effectuer des analyses de fraude et des mesures de sécurité, les employés pourraient défier le protocole et obtenir des informations personnelles.

En produisant une version synthétique d’un ensemble de données original, les mêmes mesures de sécurité peuvent être effectuées sans exposer les données personnellement identifiables.

Les entreprises de données synthétiques empruntent diverses voies pour arriver à leur résultat final. Facteus fournit aux clients un serveur installé derrière les pare-feu clients. Le serveur est chargé avec le logiciel Facteus configuré pour chaque cas d’utilisation spécifique, mais n’est pas connecté à Internet. Un client peut avoir besoin de la personnaliser pour pouvoir ingérer des données de paie électroniques ou des transactions transfrontalières, par exemple. Une fois le processus de données synthétiques effectué, les clients peuvent exporter les nouvelles données dans un nuage de données sécurisé ou les télécharger sur un serveur FTP.

L’algorithme d’apprentissage automatique du système détecte toutes les informations commerciales identifiables ou sensibles et les supprime complètement. Le processus de données synthétiques intervient lorsque ces données désidentifiées sont modifiées en ajoutant ce que les scientifiques des données appellent le «bruit de données».

«Nous n’obtenons jamais la transaction réelle», a déclaré le PDG de Facteus, Randy Koch.

Coronavirus Live Updates: les derniers développements COVID-19 à Seattle et le monde de la technologie

Plutôt que de se retrouver avec un ensemble de données qui comprend toujours des détails réels des transactions réelles, les détails numériques de ces données sont modifiés en ajoutant du bruit. Ainsi, l’achat d’un café au lait et d’une collation dans un café pour 5,60 $ à 15h18 pourrait être modifié pour montrer un achat similaire pour 5,72 $ à 15h34.

Même lors de ces changements mathématiques, les données «conservent toujours leur pertinence statistique», a déclaré Steve Shaw, vice-président marketing de Facteus.

Facteus fournit également des données synthétiques aux entreprises qui pourraient l’utiliser pour déterminer si un emplacement est judicieux pour construire un nouveau magasin en fonction des dépenses de consommation dans la région. Dans ce cas, l’entreprise donne à ses clients bancaires une réduction de la vente de données.

Une autre application des données synthétiques concerne les algorithmes d’intelligence artificielle, qui nécessitent des monticules de données. Mais dans le cas des systèmes de véhicules autonomes, par exemple, il n’existe tout simplement pas suffisamment de données réelles. Certaines sociétés de données produisent des données de formation synthétiques à partir de zéro pour les développeurs d’IA.

Entreprise privée, Facteus est rentable depuis 2016 et n’a pas levé de financement en capital-risque. “Il est difficile de démarrer de nouvelles entreprises, en particulier dans le monde des données, surtout si vous ne collectez pas beaucoup de capital-investissement et de capital-risque”, a déclaré Koch.

Koch était auparavant président de CommerceGuard, une coentreprise entre Samsung, GE, Siemens et Mitsubishi), une société mondiale de technologie et de données, avec des opérations aux États-Unis, en Asie, en Europe et au Moyen-Orient.

L’entreprise compte plus de 30 employés à temps plein. Son rapport d’impact économique est le premier d’une série prévue de rapports hebdomadaires.