Google a supprimé 749 millions d'URL d'Anna's Archive de ses résultats de recherche
-
La bibliothèque parallèle Anna’s Archive, très populaire, est devenue une cible privilégiée des détenteurs de droits d’auteur. En seulement trois ans, éditeurs et auteurs ont obtenu de Google la suppression de 749 millions d’URL du site de ses résultats de recherche. Malgré cette vaste campagne de retrait, qui représente 5 % de toutes les URL signalées à Google pour violation de droits d’auteur, le site reste facilement accessible via le moteur de recherche.
Anna’s Archive est un métamoteur de recherche pour les bibliothèques parallèles qui permet aux utilisateurs de trouver des livres piratés et d’autres sources connexes.
Le site a été lancé à l’automne 2022 , quelques jours seulement après que Z-Library ait été la cible d’une répression criminelle américaine, afin d’assurer la disponibilité continue de livres et d’articles « gratuits » pour le grand public.
En trois ans, Anna’s Archive s’est forgé une solide réputation. Le site a été bloqué dans plusieurs pays, a fait l’objet de poursuites judiciaires aux États-Unis après avoir aspiré des données de WorldCat, et apporte une aide précieuse aux chercheurs en IA souhaitant utiliser sa bibliothèque pour l’entraînement de modèles.
Malgré les pressions juridiques, Annas-archive.org et les domaines associés .li et .se restent opérationnels. Cela représente un véritable casse-tête pour les éditeurs qui s’efforcent activement de faire fermer le site. Faute de pouvoir le cibler directement, ils sollicitent l’aide d’intermédiaires tiers tels que Google.
5 % de toutes les suppressions de comptes Google, jamais enregistrées.
Depuis la publication par Google de son premier rapport de transparence en mai 2012, les titulaires de droits ont signalé 15,1 milliards d’URL prétendument “contrefaisantes” (contrefactrices ? contrefaitistes ? contrefaiseuses ? contrefoutriques ?
). Ce chiffre est impressionnant, mais le fait que 5 % de ces URL ciblent Anna’s Archive est remarquable.Penguin Random House et John Wiley & Sons sont les éditeurs les plus actifs à cibler le site, mais ils sont loin d’être les seuls. Selon les données de Google, plus de 1 000 auteurs ou éditeurs ont envoyé des notifications DMCA visant les domaines d’Anna’s Archive.
Pourtant, la situation semble sans fin. Les ayants droit signalent environ 10 millions de nouvelles URL par semaine pour la populaire bibliothèque de piratage ; le contenu à signaler ne manque donc pas.
En déposant ces notifications de retrait DMCA, les éditeurs cherchent à rendre la recherche de leurs livres sur Google aussi difficile que possible. Cette stratégie s’avère efficace : de nombreuses URL sont désormais déréférencées, tandis que d’autres sont activement déclassées par le moteur de recherche pour les requêtes liées aux livres.
Cela dit, le site web Anna’s Archive est loin d’être introuvable. Une recherche sur Google avec le nom du site affiche toujours le domaine principal en tête des résultats.

À noter le lien pointant directement sur les dataset pour I.A. (LLM data)

Source et plus: https://torrentfreak.com/google-removed-749-million-annas-archive-urls-from-its-search-results/