La vérité sort-elle aussi de la bouche des I.A. ?
-
OpenAI déclare qu’il est « impossible » de créer des modèles d’IA utiles sans matériel protégé par le droit d’auteur
“Le droit d’auteur couvre aujourd’hui pratiquement toutes les formes d’expression humaine” et ne peut être évité.
Le développeur de ChatGPT, OpenAI, a récemment reconnu la nécessité d’utiliser du matériel protégé par le droit d’auteur dans le développement d’outils d’IA comme ChatGPT, rapporte The Telegraph , affirmant qu’ils seraient « impossibles » sans cela. La déclaration fait partie d’une soumission à l’enquête du comité spécial des communications et du numérique de la Chambre des Lords du Royaume-Uni sur les grands modèles linguistiques.
Les modèles d’IA comme ChatGPT et le générateur d’images DALL-E acquièrent leurs capacités grâce à des sessions de formation alimentées, en partie, par de grandes quantités de contenus récupérés sur l’Internet public sans l’autorisation des titulaires de droits (dans le cas d’OpenAI, une partie du contenu de la formation est cependant autorisé). Ce type de grattage gratuit fait partie d’une tradition de longue date dans la recherche universitaire sur l’apprentissage automatique, mais comme les modèles d’IA d’apprentissage profond ont été récemment commercialisés, cette pratique a fait l’objet d’un examen minutieux.
“Parce que le droit d’auteur couvre aujourd’hui pratiquement tous les types d’expression humaine, y compris les articles de blog, les photographies, les messages de forum, les fragments de code logiciel et les documents gouvernementaux, il serait impossible de former les principaux modèles d’IA d’aujourd’hui sans utiliser des matériaux protégés par le droit d’auteur”, a écrit OpenAI à la Chambre. de la soumission des Lords.
En outre, OpenAI écrit que limiter les données de formation aux livres et dessins du domaine public « créés il y a plus d’un siècle » ne fournirait pas de systèmes d’IA qui « répondent aux besoins des citoyens d’aujourd’hui ».
Cette déclaration fait suite à un procès intenté le mois dernier par le New York Times contre OpenAI et Microsoft, un investisseur important dans OpenAI, pour avoir prétendument utilisé illégalement le contenu du journal dans leurs produits. OpenAI au procès sur son site Internet, affirmant que le procès manquait de fondement et affirmant son soutien au journalisme et aux partenariats avec les agences de presse. a répondu lundi
La défense d’OpenAI repose en grande partie sur le principe juridique de l’utilisation équitable , qui permet une utilisation limitée de contenu protégé par le droit d’auteur sans l’autorisation du propriétaire dans des circonstances spécifiques. La société affirme que la loi sur le droit d’auteur n’interdit pas la formation de modèles d’IA avec ce type de matériel.
“La formation de modèles d’IA à l’aide de matériels Internet accessibles au public est une utilisation équitable, soutenue par des précédents de longue date et largement acceptés”, a écrit OpenAI dans son blog de lundi. "Nous considérons ce principe comme équitable pour les créateurs, nécessaire pour les innovateurs et essentiel pour La compétitivité américaine. »
Ce n’est pas la première fois qu’OpenAI revendique une utilisation équitable de ses données de formation en IA. En août, nous avons signalé une situation similaire dans laquelle OpenAI a défendu son utilisation de matériels accessibles au public comme étant un usage loyal en réponse à une action en justice pour droits d’auteur impliquant la comédienne Sarah Silverman.
OpenAI a affirmé que les auteurs de ce procès « avaient mal compris la portée du droit d’auteur, en omettant de prendre en compte les limitations et exceptions (y compris l’utilisation équitable) qui laissent correctement la place à des innovations comme les grands modèles de langage désormais à la pointe de l’intelligence artificielle. ".
Déclaration qui fait bien les affaires des propriétaires qui engrangeront les pépètes…