L’IA va bientôt manquer de carburant : un vilain petit secret révélé
-
Les IA telles que ChatGPT et ses rivaux risquent de manquer d’un élément très précieux dans les années à venir
En matière d’intelligence artificielle, il est un élément dont on parle finalement assez peu : celui des données qui permettent de former ces modèles de langage. Dans un article passionnant publié sur le site The Conversation, Rita Matulionyte , de l’Université Macquarie à Sydney en Australie, s’est justement intéressée à ce carburant qui permet à ces technologies de fonctionner correctement.
Ce souci va-t-il mettre l’IA à l’arrêt ?
Elle cite notamment une publication scientifique datant de l’an dernier où des chercheurs prédisent que nous serons à court de données textuelles de haute qualité (articles scientifiques, Wikipédia, articles de presse…) avant 2026 si les tendances actuelles de formation se maintiennent. Quant aux données linguistiques de faible qualité (réseaux sociaux, commentaires, etc), elles seront épuisées entre 2030 et 2050. Enfin, les données d’image de faible qualité le seront entre 2030 et 2060.
Or, alors qu’on nous promet que l’IA va générer un boom de croissance économique hors du commun dans les années à venir, on peut se demander si cela ne va pas sonner le glas de ces espérances ?
L’experte préfère voir le verre à moitié plein. Ainsi, les développeurs pourraient notamment perfectionner leurs algorithmes de sorte d’utiliser les données plus efficacement qu’aujourd’hui. De quoi également réduire l’empreinte carbone de cette technologie.
On peut aussi envisager d’utiliser l’IA pour créer des données synthétiques permettant de former les systèmes. Enfin, la numérisation d’œuvres ayant été publiées avant l’arrivée d’Internet peut aussi offrir de la nouvelle matière à ces programmes.
En matière de données, il faudra aussi régler le problème épineux de la rémunération des auteurs et des artistes qui réclament leur dû. Une demande qui n’est forcément pas du goût des entreprises technologiques qui aimeraient en profiter gratuitement.
Rita Matulionyte rappelle ainsi les dernières polémiques qui ont récemment émaillé l’actualité judiciaire :
Les créateurs de contenu ont protesté contre l’utilisation non autorisée de leur contenu pour entraîner des modèles d’IA, et certains ont intenté des procès à des entreprises telles que Microsoft, OpenAI et Stability AI. Le fait d’être rémunérés pour leur travail pourrait contribuer à rétablir le déséquilibre des pouvoirs entre les créateurs et les entreprises d’IA.
L’IA a un problème d’eau
Quoi qu’il en soit, c’est un véritable caillou dans la chaussure des développeurs de ces technologies. Ils doivent également gérer d’autres soucis propres au développement durable. Il y a quelques mois, nous vous expliquions par exemple à quel point ces outils sont très gourmands en eau. Vous pouvez d’ailleurs toujours relire notre article ici.
Source: https://www.presse-citron.net/chatgpt-nest-pas-alcoolique-mais-il-a-un-vrai-soucis-avec-leau/
Il est déjà difficile de faire le tri dans la propagande, la publicité le complotisme et les réseaux sociaux, la pollution des données rend son utilisation malcommode et peu sûre.
-
@duJambon a dit dans L’IA va bientôt manquer de carburant : un vilain petit secret révélé :
données linguistiques de faible qualité (réseaux sociaux, commentaires, etc)
C’est épuisable ça !?
-
@michmich Ça reste encore utilisable si tu refourgue aux idiots leur propre matériel…
Tout peut se vendre
Mais fait rédiger un rapport avec des niktamère ou des ziva… ça risque de coincer un peu.