Dans un essai limpide, la journaliste Coralie Lemke dresse la cartographie du business juteux des données de santé. Recherche médicale, laboratoires, patients… À qui profite ce marché en plein boom ?
Août 2018. 23andMe, société californienne de tests ADN, annonce la vente des données génétiques de 5 millions de clients au laboratoire pharmaceutique britannique GSK. C’est ce genre d’actualité, sur lesquelles les laboratoires ne préfèrent pas trop s’étendre, qui a mis la puce à l’oreille de Coralie Lemke, journaliste spécialiste de la santé chez L’Usine Nouvelle puis Sciences et Avenir.
Quelques années et une pandémie plus tard, le sujet est brûlant et le premier livre de la journaliste, Mes données, ma santé, publié ce 15 septembre chez Premier Parallèle, bienvenu. Il raconte comment le secret médical s’érode à la faveur de la naissance d’un nouvel Eldorado économique : les données de santé.
Nous en disséminons un peu partout – de Doctolib à l’envoi mail de nos résultats d’examens – et elles se revendent (très) bien sur le dark web. Recherche médicale, laboratoires, patients… À qui profite ce marché en plein boom ?
Les données de santé représentent les données les plus hackées au niveau mondial, écrivez-vous. Ces attaques se sont-elles multipliées à la faveur de la pandémie ?Coralie Lemke : Au début de la pandémie, des groupes de hackers ont assuré qu’ils ne s’en prendraient pas aux hôpitaux… La promesse n’a duré que quelques semaines. La pandémie était une aubaine pour les cybercriminels, car elle a mis au grand jour les vulnérabilités des systèmes informatiques hospitaliers, qui se sont trouvés débordés. Les cyberattaques d’hôpitaux sont devenues monnaie courante. Leur nombre a quasiment été multiplié par 5 entre février et mars 2020. C’est énorme !
Les données n’ont pas forcément pris de la valeur – on sait que sur le dark web, une donnée sur un patient peut valoir jusqu’à 250 euros, le prix varie en fonction de sa nature. Mais elles sont apparues plus facilement accessibles. Les dossiers médicaux piratés constituent un moyen de pression redoutable. Et ils sont aussi très faciles à revendre car il y a une demande importante.
Qui s’intéresse à ces données ?C.L. : Les hackers sont les intermédiaires. Eux se chargent de récupérer les données, pour pouvoir les revendre sur le dark web. Parmi les acheteurs finaux, on trouve plusieurs profils. D’abord les gouvernements pour connaître, par exemple, la situation sanitaire de pays ennemis. Cela peut aussi intéresser des laboratoires pharmaceutiques, pas forcément pour mettre au point des médicaments, mais aussi pour connaître la situation d’un concurrent par rapport à la sienne dans un pays précis, afin d’ajuster sa stratégie marketing. Ils restent d’ailleurs très discrets sur cette activité. Il y a aussi les startups de la santé qui s’y intéressent.
Cette guerre économique autour de la donnée de santé en vaut-elle la chandelle ? Collecter autant de données a-t-il un intérêt au niveau médical ?C.L. : Tout dépend de comment les données sont récoltées et de qui les analyse. Tout le monde ne peut en tirer quelque chose. Mais il est certain que les données sont cruciales pour la recherche médicale. Un des exemples les plus parlants pour illustrer cela remonte à 1948, lors d’une étude qui a eu lieu dans la ville de Framingham, dans le Massachusetts. Elle est considérée comme un modèle d’étude épidémiologique et la naissance des données de santé telles qu’on les connaît aujourd’hui. Des chercheurs ont suivi plus de 5 000 habitants de cette ville, qui aurait l’avantage d’être à peu près représentative de la population américaine. Le but était d’étudier la survenue des maladies cardiovasculaires en suivant le poids, la fréquence cardiaque, les habitudes alimentaires des participants. C’est ce suivi sur le long cours et en temps réel (l’étude continue aujourd’hui avec les descendants des premiers participants) qui a par exemple fait naître le concept de « patients à risque » pour les maladies cardio-vasculaires.
Dans votre livre, vous soulignez aussi les promesses déçues de la collecte massive de données de santé. Notamment du côté des GAFAM…C.L. : Oui car les données que captent les applications, montres et bracelets connectés – heures de sommeil, poids, nombre de pas par jour… ne permettent pas de déduire grand-chose de la santé d’un individu. En l’état elles ne valent pas grand-chose. Il faut qu’elles soient croisées avec des données médicalisées : comme le taux de sucre dans le sang par exemple. Fitbit a essayé de monter une étude sur l’hypertension artérielle, mais elle n’a pour le moment pas donné de résultats probants. Car les données que collectent ces équipements connectés ne sont pas aux normes d’une captation médicale. Elles n’ont d’ailleurs pas un statut très clair. La CNIL ne les considère pas comme des données de santé, donc elles ne sont pas soumises à des règles très strictes. Ce qui peut d’ailleurs être problématique car elles peuvent donner un indice sur la santé d’une personne – sans pour autant être très utiles à la recherche médicale. Elles servent en fait surtout à faire du ciblage publicitaire.
En revanche, l’avantage des Gafam c’est l’intelligence artificielle. C’est là où ils ont un rôle à jouer. Alphabet de Google a par exemple mis au point un algorithme capable de repérer des lésions cancéreuses à un stade précoce, surpassant le diagnostic des médecins. Celui-ci a donné lieu à un article dans la revue scientifique Nature. Mais le géant du web n’était pas seul, il était entouré de 7 centres de recherche spécialisés dans le cancer.
Il y a donc une hiérarchie entre les données de santé. Quelles sont celles qui ont le plus de valeur ?C.L. : Les données génétiques : c’est le Graal ! Elles permettent de connaître le risque d’une personne de développer une maladie, savoir à quoi cette personne ressemble, sa taille, sa couleur de peau, en décodant son code génétique. Ces données sont collectées par des entreprises de test ADN comme 23andMe, Ancestry, My Heritage… La façade c’est d’aller chercher les origines géographiques des utilisateurs, retrouver des membres de leur famille… Mais le vrai fonds de commerce de ces entreprises c’est de revendre des données aux laboratoires pharmaceutiques. Comme l’a fait 23andMe auprès de GSK pour faire avancer la recherche sur les traitements contre Parkinson. Sauf que la plupart des clients de 23andMe ont accepté ce partenariat – mentionné dans une petite ligne des conditions d’utilisation – sans en avoir réellement conscience. 80 % des clients ont accepté de livrer leurs données génétiques à GSK. C’est une forme de double peine car ils n’ont obtenu aucune compensation en l’échange de l’exploitation de leur patrimoine génétique et devront payer s’ils ont un jour besoin d’un de ces médicaments pour se soigner. Peu importe que la molécule ait été créée à partir de leurs données de santé.
Les laboratoires s’intéressent aussi à des réseaux sociaux étonnants comme PatientsLikeMe…C.L. : Oui c’est un site peu connu en France, sur lequel des patients (environ 830 000) réunis en communauté (autour de maladies comme le Sida, la maladie de Charcot, l’épilepsie…) échangent des informations et partagent volontairement leurs dossiers médicaux… Il y a aussi un site équivalent en France qui s’appelle Carenity. Évidemment ces données intéressent les laboratoires. D’autant plus que certaines communautés échangent sur des maladies rares sur lesquelles très peu de données sont normalement disponibles, y compris chez les hôpitaux. Pour les laboratoires, cela représente une niche intéressante. Certains comme AstraZeneca ont déjà noué des partenariats avec PatientsLikeMe.
Source : ladn.eu