Sans surprise, Open Ai hallucine de plus en plus
-
Ainsi, des évaluations internes révèlent que le taux d’hallucination d’o3 sur le benchmark PersonQA atteint environ le double de celui des anciens modèles, tandis qu’o4-mini affiche un taux encore plus élevé. Sur certains tests, près de la moitié des réponses générées par o4-mini comportaient des éléments erronés. OpenAI admet ne pas comprendre précisément les causes de cette hausse et souligne la nécessité de poursuivre les recherches pour y remédier.
Les humains peuvent supporter les contradictions, les ordinateurs, beaucoup moins…
même s’ils peuvent tricher avec une division par zéro ou une racine carrée de moins un…Et encore:
Bonjour ! Vous semblez intéressé par cette conversation, mais vous n’avez pas encore de compte.
Marre de refaire défiler les mêmes messages ? Créez un compte pour retrouver votre position, recevoir des notifications des nouvelles réponses, sauvegarder vos favoris et voter pour les messages que vous appréciez.
Grâce à votre participation, ce message peut devenir encore meilleur 💗
S'inscrire Se connecter