Pour essayer de contrer Google, OpenAI sort GPT5-2 en catastrophe
-
L’entreprise affirme que son nouveau modèle d’IA surpasse Gemini et égale les humains dans 70 % des tâches professionnelles.
…en vitesse (ah bon !) 
Jeudi, OpenAI a lancé GPT-5.2, sa toute nouvelle famille de modèles d’IA pour ChatGPT, déclinée en trois versions : Instant, Thinking et Pro. Cette publication fait suite à la note interne d’urgence émise par le PDG Sam Altman au début du mois, qui réorientait les ressources de l’entreprise vers l’amélioration de ChatGPT face à la concurrence du modèle d’IA Gemini 3 de Google .
« Nous avons conçu la version 5.2 pour générer encore plus de valeur économique pour les utilisateurs », a déclaré Fidji Simo, directeur des produits chez OpenAI, lors d’une conférence de presse jeudi. « Elle est plus performante pour créer des feuilles de calcul, élaborer des présentations, écrire du code, percevoir des images, comprendre le contexte à long terme, utiliser des outils et relier des projets complexes à plusieurs étapes. »
Comme pour les versions précédentes de GPT-5, les trois niveaux du modèle ont des objectifs différents : Instant gère les tâches plus rapides comme l’écriture et la traduction ; Thinking produit un texte de « réflexion » simulé pour tenter de s’attaquer à des tâches plus complexes comme le codage et les mathématiques ; et Pro produit encore plus de texte de raisonnement simulé dans le but d’offrir les performances les plus précises pour les problèmes difficiles.
(Ici un benchmark entre la version 5.1 et la 5.2 il y a un mot tout en bas à ce sujet)
Étrangement, bien que la sortie du modèle GPT-5.2 soit censée répondre aux performances de Gemini 3, OpenAI a choisi de ne publier aucun benchmark comparatif entre les deux modèles sur son site web promotionnel.
GPT-5.2 dispose d’une fenêtre de contexte de 400 000 jetons, lui permettant de traiter des centaines de documents à la fois, et d’une date limite de connaissances fixée au 31 août 2025.
GPT-5.2 sera déployé auprès des abonnés payants de ChatGPT à partir de jeudi, avec un accès API disponible pour les développeurs. Le prix de l’API est de 1,75 $ par million de jetons d’entrée pour le modèle standard, soit une augmentation de 40 % par rapport à GPT-5.1. OpenAI précise que l’ancienne version GPT-5.1 restera disponible dans ChatGPT pour les utilisateurs payants pendant trois mois, dans un menu déroulant dédié aux anciens modèles.
Rattraper son retard sur Google
Cette annonce intervient après un mois difficile pour OpenAI. Début décembre, Altman a émis une directive interne d’alerte maximale suite à la performance exceptionnelle du modèle Gemini 3 de Google, qui a surpassé plusieurs benchmarks d’IA et conquis des parts de marché. La note de service préconisait le report d’autres initiatives, notamment les plans publicitaires pour ChatGPT, afin de se concentrer sur l’amélioration de l’expérience utilisateur du chatbot.
Les enjeux sont considérables pour OpenAI. L’entreprise s’est engagée à investir 1 400 milliards de dollars dans le développement de son infrastructure d’IA au cours des prochaines années, des investissements réalisés lorsqu’elle bénéficiait d’une avance technologique plus marquée parmi les entreprises du secteur. L’application Gemini de Google compte désormais plus de 650 millions d’utilisateurs actifs mensuels, tandis qu’OpenAI revendique 800 millions d’utilisateurs actifs hebdomadaires pour ChatGPT.
Pour rester compétitif, OpenAI déploie des modèles à un rythme soutenu : GPT-5.2 est la troisième mise à jour majeure depuis août. Lancée en août, GPT-5 proposait un nouveau système de routage permettant d’alterner entre réponse instantanée et raisonnement simulé, mais les utilisateurs ont déploré de novembre le manque de naturel et de spontanéité des réponses. La mise à jour GPT-5.1 a ajouté huit options de « personnalité » prédéfinies et s’est concentrée sur l’amélioration du comportement conversationnel du système.
OpenAI affirme que GPT-5.2 Thinking surpasse ou égale les performances des experts humains dans 70,9 % des tâches du benchmark GDPval (contre 53,3 % pour Gemini 3 Pro). L’entreprise affirme également que le modèle accomplit ces tâches plus de 11 fois plus rapidement et à un coût inférieur à 1 % de celui des experts humains.
Selon Max Schwarzer, responsable du post-entraînement chez OpenAI, GPT-5.2 Thinking génère également des réponses avec 38 % de confabulations en moins que GPT-5.1, qui a déclaré à VentureBeat que le modèle « hallucine sensiblement moins » que son prédécesseur.
Cependant, nous prenons toujours les benchmarks avec des pincettes, car il est facile de les présenter de manière positive pour une entreprise, surtout lorsque la science de la mesure objective des performances de l’IA n’a pas encore rattrapé les arguments de vente des entreprises en faveur de capacités d’IA quasi humaines.
Les résultats de tests comparatifs indépendants réalisés par des chercheurs extérieurs à OpenAI ne seront pas disponibles avant un certain temps. En attendant, si vous utilisez ChatGPT pour vos tâches professionnelles, vous pouvez vous attendre à des modèles performants bénéficiant d’améliorations progressives et d’une optimisation du code.