Avec le lancement d'o3-pro, parlons de ce que fait réellement le « raisonnement » de l'IA
-
OpenAI lance o3-pro : un modèle avancé de raisonnement simulé
Résumé chatgpt
Nouveautés
- o3-pro remplace o1-pro pour les utilisateurs de ChatGPT Pro et Team.
- Conçu pour exceller en mathématiques, sciences, programmation.
- Intègre : recherche web, exécution Python, analyse de fichiers et d’images.
- Recommandé pour des tâches complexes, malgré un temps de réponse plus long.
Réduction massive des coûts API
- o3-pro : 20 $ / million de jetons d’entrée, 80 $ / million en sortie (−87 %).
- o3 standard : baisse de 80 %.
- Vise à rendre les modèles de « raisonnement » plus accessibles.
Performances
- o3-pro surpasse o1-pro et o3 sur des benchmarks : (encore heureux)
- 84 % sur des questions scientifiques de niveau doctorat.
- Score élevé en programmation sur Codeforces.
Le “raisonnement simulé” expliqué
- Ce « raisonnement » n’est pas humain, mais une simulation de raisonnement par chaîne de pensée.
- Il consiste à « réfléchir à voix haute » en générant des étapes intermédiaires, ce qui réduit certaines erreurs, surtout mathématiques.
- Les modèles ne comprennent pas leurs erreurs, et imitent des schémas appris, sans logique réelle ou conscience.
🧩 Limites fondamentales
- Échecs fréquents sur des problèmes inédits comme la Tour de Hanoï.
- Leur fonctionnement reste basé sur la reconnaissance de motifs, pas un raisonnement algorithmique.
- Certains chercheurs doutent que cette approche suffira pour atteindre une IA générale.
Pistes d’amélioration
- Auto-cohérence (comparaison de plusieurs solutions générées).
- Autocritique (tentatives d’auto-évaluation).
- Outils externes (symbolique, vérification formelle, calculatrices) pour compenser les limites des LLM.
Conclusion
o3-pro est une avancée utile et moins coûteuse, performante sur des tâches bien définies. Toutefois, son « raisonnement » est simulé et limité. Il reste essentiel de vérifier les résultats et de comprendre que ces modèles ne « pensent » pas comme les humains.