Ingénieurs de Facebook : « Nous n'avons aucune idée de l'endroit où nous conservons toutes vos données personnelles »
-
Ont-ils déclarés lors d’une audience au tribunal
Plus tôt cette année, il été a fait état d’un document interne de Facebook indiquant que l’entreprise n’a aucune idée de l’endroit où vont les données des utilisateurs, ni de ce qu’elle en fait. Au cours d’une audience judiciaire précédemment scellée en mars, deux ingénieurs chevronnés de Facebook ont confirmé ce que le document divulgué révélait. L’audience, dont la transcription a été récemment rendue publique, visait à résoudre une question cruciale : Quelles informations, précisément, Facebook stocke-t-il sur nous, et où sont-elles ? La réponse des ingénieurs ne soulagera guère ceux qui s’inquiètent de la gestion par l’entreprise de milliards de vies numérisées : Ils ne savent pas.
L’audience faisait partie d’un procès de plusieurs années sur le scandale Cambridge Analytica. L’audience a mis en vedette Eugene Zarashow, un directeur de l’ingénierie de Facebook qui travaille pour l’entreprise depuis 2011, selon son profil LinkedIn et Steven Elia, un ingénieur logiciel gestionnaire qui travaille également chez Facebook depuis 2011, selon leurs profils LinkedIn. L’audience était dirigée par Daniel Garrie, qui a été nommé “Discovery Special Master”, un expert neutre qui tient des audiences pour résoudre une impasse sur la question de savoir si Facebook doit produire des documents supplémentaires dans l’affaire, selon le document du tribunal.
Les aveux ont été faits lors d’une audience Garrie tentait d’obtenir de l’entreprise qu’elle fournisse une comptabilité exhaustive et définitive de l’endroit où les données personnelles pourraient être stockées dans quelque 55 sous-systèmes de Facebook. Les deux ingénieurs chevronnés de Facebook, qui ont, selon LinkedIn, deux décennies d’expérience à eux deux, ont eu du mal à s’imaginer ce qui pouvait être stocké dans les sous-systèmes de Facebook. « J’essaie juste de comprendre au niveau le plus basique de cette liste ce que nous regardons », a demandé Garrie.
« Je ne crois pas qu’il existe une seule personne qui puisse répondre à cette question. Il faudrait un effort d’équipe important pour pouvoir même répondre à cette question », a répondu Eugene Zarashaw. Interrogé sur la façon dont Facebook pourrait retrouver toutes les données associées à un compte utilisateur donné, Zarashaw est à nouveau resté perplexe : « Il faudrait plusieurs équipes du côté de la publicité pour retracer exactement où les données circulent. Je serais surpris qu’une seule personne puisse répondre de manière concluante à cette question précise ».
Dans une déclaration Dina El-Kassaby, porte-parole de Meta, a déclaré que l’incapacité d’un seul ingénieur à savoir où toutes les données des utilisateurs étaient stockées n’était pas une surprise. Elle a déclaré que Meta s’efforçait de protéger les données des utilisateurs, ajoutant : « Nous avons fait et continuons de faire des investissements importants pour respecter nos engagements et obligations en matière de confidentialité, y compris des contrôles de données étendus ».
Un litige vieux de quatre ans
Le différend concernant l’endroit où Facebook stocke les données est apparu lorsque, dans le cadre du litige, qui en est maintenant à sa quatrième année, le tribunal a ordonné à Facebook de fournir les informations qu’il avait recueillies sur les plaignants. L’entreprise s’est exécutée mais a fourni des données constituées principalement de matériel que tout utilisateur pouvait obtenir par le biais de l’outil “Download Your Information” accessible au public.
Facebook a soutenu que toutes les données qui n’étaient pas incluses dans cet ensemble n’entraient pas dans le cadre de l’action en justice, ignorant les vastes quantités d’informations que l’entreprise génère par le biais de déductions, de partenariats externes et d’autres analyses non publiques de nos habitudes ; des parties du fonctionnement interne du site de médias sociaux qui sont obscures pour les consommateurs. En bref, ce que nous considérons comme “Facebook” est en fait un ensemble de programmes spécialisés qui fonctionnent ensemble lorsque nous téléchargeons des vidéos, partageons des photos ou sommes ciblés par des publicités. Le réseau social souhaitait que le stockage des données dans ces parties de Facebook qui ne sont pas destinées aux consommateurs reste à l’abri des tribunaux.
En 2020, le juge a rejeté l’argument de l’entreprise, estimant que la divulgation initiale de Facebook était effectivement trop éparse et que l’entreprise devait révéler les données obtenues grâce à sa capacité à surveiller les gens sur Internet et à faire des prédictions monétisables sur leurs prochains mouvements.
Les tergiversations de Facebook ont été révélatrices en elles-mêmes, avec des variations sur le même thème : Facebook a accumulé tant de données sur tant de milliards de personnes et les a organisées de manière si confuse qu’une transparence totale est impossible sur le plan technique. Lors de l’audition du 20 mars 2022, Zarashaw et Steven Elia, un responsable de l’ingénierie logicielle, ont décrit Facebook comme un appareil de traitement des données si complexe qu’il défie toute compréhension de l’intérieur. Lors de l’audition, deux ingénieurs de haut rang de l’une des sociétés d’ingénierie les plus puissantes et les plus riches en ressources de l’histoire ont décrit leur produit comme une machine méconnaissable.
L’avocat général a parfois semblé incrédule, comme lorsqu’il a demandé aux ingénieurs s’il existait une documentation pour un sous-système particulier de Facebook. « Quelqu’un doit avoir un diagramme qui dit que c’est là que ces données sont stockées », a-t-il dit, selon la transcription. Zarashaw a répondu : « Nous avons une culture d’ingénierie quelque peu étrange par rapport à la plupart des autres, où nous ne générons pas beaucoup d’artefacts pendant le processus d’ingénierie. En fait, le code est souvent son propre document de conception ». Il a rapidement ajouté : « Pour ce que ça vaut, c’est aussi ce qui m’a terrifié lorsque j’ai rejoint l’entreprise ».
Les remarques formulées lors de l’audition font écho à celles que l’on trouve dans le document interne divulgué plus tôt cette année, détaillant comment le dysfonctionnement de l’ingénierie interne chez Meta, qui possède Facebook et Instagram, rend impossible le respect des lois sur la confidentialité des données. « Nous n’avons pas un niveau adéquat de contrôle et d’explicabilité sur la façon dont nos systèmes utilisent les données, et nous ne pouvons donc pas faire en toute confiance des changements de politique contrôlés ou des engagements externes tels que 'nous n’utiliserons pas les données X dans un but Y », peut-on lire dans le document de 2021.
Le problème fondamental, selon les ingénieurs entendus, est que l’éparpillement de Facebook a fait qu’il n’est plus possible de savoir de quoi il se compose ; l’entreprise n’a jamais pris la peine de cultiver une connaissance institutionnelle du fonctionnement de chacun de ces systèmes composants, de ce qu’ils font ou de qui les utilise. Il n’existe aucune documentation sur ce qu’il advient de vos données une fois qu’elles sont téléchargées, parce que cela n’a jamais été quelque chose que l’entreprise fait, ont expliqué les deux hommes. “Il est rare qu’il existe des artefacts et des diagrammes sur la façon dont ces systèmes sont ensuite utilisés et sur les données qui y circulent réellement”, a expliqué Zarashaw.
L’incapacité de Facebook à comprendre son propre fonctionnement a conduit l’audience à la limite du métaphysique. À un moment donné, l’expert nommé par le tribunal a noté que le fichier “Download Your Information” fourni aux plaignants ne devait pas inclure tout ce que l’entreprise avait stocké sur ces personnes, car il semble qu’elle n’ait aucune idée de ce qu’elle stocke réellement sur quiconque. Se peut-il que l’outil désigné par Facebook pour télécharger vos informations de manière exhaustive ne télécharge pas réellement toutes vos informations ? Là encore, cela dépasse les limites de la connaissance.
« La solution à ce problème est malheureusement exactement le travail qui a été fait pour créer le fichier DYI lui-même. Et ce qui me pose problème ici, c’est que pour trouver des lacunes dans ce qui pourrait ne pas être dans le fichier DYI, il faudrait par définition faire encore plus de travail que ce qui a été fait pour générer les fichiers DYI en premier lieu », a noté Zarashaw.
Le brouillard systémique du stockage des données de Facebook rendait futile la réponse à la question la plus élémentaire. À un autre moment, le maître spécial a demandé comment on pouvait trouver quels systèmes contiennent réellement des données d’utilisateur créées par inférence machine. « Je ne sais pas. C’est une énigme plutôt difficile », a répondu Zarashaw.
Sources : Documents de Justice ,Document interne Facebook, web.developpez.com
-
Heureusement que ce n’est ni ma banque, ni mon cloud
Ils ne mentent pas forcément, il n’y a pas besoin de savoir où sont les données, tant que l’index de la db le sait.
Et d’ailleurs, ma banque non plus ne sait pas où vont mes billets d’origine.
-
Avec tout ce qu’on apprend sur Facebook, les gens continuent de l’utiliser et ils sont toujours pas jugés