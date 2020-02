Les étudiants de Harvard ont créé un outil qui examine les ensembles de données des consommateurs à partir des violations de données pour trouver un document de classe sur lequel ils travaillent. En conséquence, ils ont découvert que les données que les entreprises prétendent «anonymiser» peuvent en fait ne pas être si anonymes après tout (via Vice).

Données anonymes

Les ensembles de données qu’ils utilisent contiennent des informations personnelles identifiables (PII) des violations de données. Il peut s’agir d’informations telles que des adresses e-mail et des noms d’utilisateur, mais même des adresses et des numéros de téléphone. Cela dépend de la violation de données. Une de ces violations a été commise par Experian, qui a divulgué le PII de six millions d’Américains.

Les étudiants, Dasha Metropolitansky et Kian Attari, se sont demandés s’ils pouvaient identifier un individu parmi d’autres violations de données. En analysant des milliers d’ensembles de données, dont beaucoup contiennent des données «anonymisées», ils ont constaté que l’identification des individus n’était pas difficile.

Nous avons montré qu’un ensemble de données «anonymisé» d’un endroit peut facilement être lié à un ensemble de données non anonymisé d’un autre endroit via une colonne qui apparaît dans les deux ensembles de données. Nous ne devons donc pas supposer que nos informations personnelles sont sécurisées simplement parce qu’une entreprise prétend limiter la quantité qu’elle collecte et stocke.

La question que je me pose est de savoir si leur outil pourrait identifier les personnes à partir des données qu’Apple exécute via son processus de confidentialité différentiel.

Lectures complémentaires

[Apple Releases Details on Differential Privacy…]

[‘Sudo’ Flaw Found and Patched in macOS Terminal]