Contre attaque d'OpenAI: A quel point les articles du New York Times sont vraiment originaux ?
-
OpenAI veut savoir dans quelle mesure les articles du New York Times sont « originaux » et méritent d’être protégés par le droit d’auteur. La société AI recherche des sources de journalistes pour l’aider à se défendre contre une plainte pour violation de droits d’auteur de plusieurs millions déposée précédemment par le journal. Le Times s’oppose à cette demande d’information ainsi qu’à d’autres, suggérant que l’approche d’OpenAI est trop large et pourrait potentiellement avoir un effet dissuasif.
Depuis l’année dernière, divers ayants droit ont commencé à intenter des poursuites contre les entreprises qui développent des modèles d’IA.
La liste des plaignants comprend des maisons de disques, des auteurs de livres, des artistes visuels et des journaux, dont le New York Times. Ces ayants droit s’opposent tous à l’utilisation présumée de leur travail pour former des modèles d’IA sans compensation adéquate.
Le procès du New York Times vise OpenAI et Microsoft et progresse régulièrement. OpenAI a récemment indiqué qu’elle aimerait consolider cette affaire avec une action en justice similaire intentée par d’autres journaux , mais le Times s’oppose à cette proposition.
Même si ces questions sont débattues devant les tribunaux, les deux parties ont également procédé à l’enquête préalable. Cela permet essentiellement à une partie de demander des preuves à l’autre, pour soutenir ou réfuter correctement les allégations de violation du droit d’auteur qui constituent la base du procès.
OpenAI recherche du matériel « source » du New York Times
Dans sa quête de preuves, OpenAI s’intéresse particulièrement aux droits d’auteur des œuvres du New York Times. Cela inclut les articles de presse protégés par le droit d’auteur, qui sont souvent basés sur diverses informations recueillies par ses journalistes.
Par exemple, les demandes de découverte non. 10-12 lire comme suit :
NON. 10 : Documents suffisants pour identifier le contenu expressif, original et d’origine humaine de chacune de vos œuvres revendiquées.
NON. 11 : Documents suffisants pour identifier le contenu non expressif, non original ou non d’origine humaine de chacune de vos œuvres revendiquées.
NON. 12 : Documents suffisants pour montrer chaque œuvre écrite qui a éclairé la préparation de chacune de vos œuvres affirmées, quels que soient sa longueur, son format ou son support.
Le New York Times n’est pas satisfait de cette approche. La société a refusé de partager les notes des journalistes et d’autres informations, car cela serait trop général et trop fastidieux. En outre, le Times a souligné qu’une grande partie des informations recherchées par OpenAI sont protégées par le privilège du journaliste.
OpenAI dépose une requête pour contraindre
Le refus a créé un différend entre les parties et OpenAI a exhorté le tribunal à intervenir. Idéalement, la société d’IA souhaite que le tribunal oblige le Times à coopérer.
OpenAI suggère que les informations sur la « source » aideront à déterminer quelles parties des articles sont « originales » et dignes de protection par le droit d’auteur, ce qui peut l’aider à contrer les allégations de violation du droit d’auteur.
“[L]e Times ne peut pas intenter de poursuite pour violation de toute partie d’une œuvre protégée par le droit d’auteur qui n’est pas originale du Times, comme ce serait le cas si le Times copiait l’œuvre ou les éléments d’autrui dans le domaine public”, écrit OpenAI.
Dans sa plainte, le Times décrit comment il investit énormément de temps et d’expertise dans ses articles, qui sont parfois le résultat de mois ou d’années d’enquêtes approfondies. OpenAI aimerait savoir ce qu’implique cette affirmation.
« Ayant choisi de remettre directement en question la manière dont le Times a créé les œuvres en question – y compris les méthodes, le temps, la main-d’œuvre et l’investissement – OpenAI a le droit d’en découvrir davantage », écrit OpenAI.
En préparation de sa défense, OpenAI souhaite en outre savoir quelles parties des articles protégés par le droit d’auteur sont du « contenu expressif, original, d’origine humaine » et quelles parties sont du « contenu non expressif, non original ou d’origine non humaine ». »
Le New York Times refuse de se conformer
En réponse à la requête en contravention, le Times indique clairement que l’entreprise n’a pas l’intention de céder. Il souligne que ses articles sont protégés par le droit d’auteur, qu’ils incluent ou non du matériel tiers.
« OpenAI prétend que les notes des journalistes sous-tendant les œuvres revendiquées peuvent permettre de déterminer si les articles de presse du Times sont réellement un contenu original et expressif – mais ce n’est pas ainsi que fonctionne la loi sur le droit d’auteur. Le caractère expressif d’une œuvre est déterminé par référence à l’œuvre elle-même.
“De plus, même dans le cas improbable où les notes d’un journaliste montrent que 90 % d’un article comprend des citations textuelles des sources originales de l’auteur, cet article serait toujours protégé par le droit d’auteur”, ajoute le Times.
En outre, le journal réitère que les demandes d’interrogatoire préalable sont excessives et portent atteinte au privilège du journaliste. Bien qu’OpenAI ait souligné qu’elle ne cherchait pas à identifier de sources confidentielles, sa demande de découverte pourrait avoir un effet dissuasif.
Si les organismes journalistiques sont tenus de divulguer tous les documents sources de chaque article protégé par le droit d’auteur, cela peut avoir de graves conséquences sur leur capacité ou leur volonté d’engager des poursuites en justice contre les contrevenants potentiels.
Mais c’est peut-être précisément ce qu’OpenAI a essayé de réaliser ici, note le journal.
“En effet, étant donné la portée tout à fait inappropriée de cette demande, il faut se demander si un effet dissuasif est exactement ce qu’OpenAI, qui semble avoir volé des millions de créateurs de contenu, espère”, écrit le Times.