I.T Guy
"Avez-vous d'abord tenté d'éteindre et de rallumer ?" Les sauveteurs numériques, experts en débogage et spécialistes du “retirer-brancher”. Quand un problème survient, leur première question est toujours la même, et ça fonctionne 99 % du temps.
Messages
-

ChatGPT Santé a été annoncé il y a deux semaines et ce n’est pas le projet qui lance l’utilisation des LLM en santé. Mais une recherche récente sur les réponses des modèles de langage concernant des questions sur la santé montre qu’ils peuvent générer des conseils problématiques, notamment en faisant des erreurs par omission.
Avec le lancement de ChatGPT Santé, la santé voit l’IA générative et l’utilisation des modèles de langage dans son champ promues largement dans les mains du grand public. Pourtant, des chercheurs montrent que les réponses de chatbots peuvent être très problématiques.
Nous sommes à « un moment où les puissants modèles d’apprentissage automatique (LLM) sont intégrés dans les soins aux patients plus rapidement que leurs risques ne peuvent être compris », affirme David Wu de l’école de médecine de Harvard, Ethan Goh de l’école de médecine de Stanford et leurs collègues. Ils ont récemment mis en ligne une étude (sur la plateforme de prépublication arXiv) qui teste 31 modèles et constate le risque de préjudice grave lié aux recommandations données par ces 31 LLM.
D’abord, ne pas faire de mal
« Primum non nocere [d’abord, ne pas faire de mal en français ou, first do no harm en anglais] est un principe fondamental de la médecine depuis des milliers d’années », rappellent-ils dans leur article. C’est inspiré de ce principe qu’ils proposent leur benchmark NOHARM (Numerous Options Harm Assessment for Risk in Medicine) qui s’appuie sur 100 cas réels de consultations entre médecins généralistes et spécialistes pour mesurer la fréquence et la gravité des préjudices causés par les recommandations médicales générées par les LLM.
Ici, l’idée est donc de s’intéresser aux outils d’IA générative utilisés par des médecins pour les assister et de vérifier que les réponses ne poussent pas à l’erreur : « Il n’est pas encore clair si l’acquisition de connaissances [dans les LLM] constitue un indicateur d’une prise en charge clinique sûre et efficace », expliquent-ils.
Leur benchmark mesure que Gemini 2.5 Flash et Pro, LiSA 1.0, Claude Sonnet 4.5 et DeepSeek R1 font le moins d’erreurs graves (entre 11,8 et 14,6 en moyenne. sur environ 500 questions) alors que o4 mini et GPT-4o en font beaucoup plus (entre 39,9 et 40,1). On peut aussi retrouver les données de leur benchmark ici.

Ils analysent leurs résultats en expliquant que « les LLM commettent des erreurs préjudiciables à des taux non négligeables, et les indicateurs courants d’évaluation des modèles (par exemple, leur nouveauté, la taille en fonction des paramètres, les modes de raisonnement et les performances sur les benchmarks d’intelligence artificielle générale) ne permettent pas de prédire de manière fiable ces performances ».
[…]
Suite de l’article réservé aux abonnés : next.ink
-
API Désactivée - update
1 février 2026
L’API a été désactivée suite a une création d’un IRC interdite et non souhaitée par le staff rendant tout le contenu disponible accessible sur le net ce qui nuit donc à la sécurité des membres.
Elle a donc été désactivée et ne reviendra pas dans l’immédiat sous sa forme que vous connaissez mais une version plus aboutie, avec l’upload et d’autres features.
Merci pour votre compréhension, je vais bosser pour rétablir la stack *Arr le plus rapidement possible. -
@Aerya a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
@Violence prends-en une, même d’occasion.
Ouai faut que je vois @Aerya
ça m’aiderait clairement pour le tarif mais j’ai toujours peur de l’occaz sur ses trucs là. Je vais clairement y réfléchir… -
Bienvenue ici @Argali
-
@Psyckofox a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
Une très très bonne machine qui équivaut au hardware d’une switch 1 à peu de chose près.
Ouai c’est sur @Psyckofox , entièrement d’accord, puis pour du streaming et de la lecture vidéo, c’est l’idéal actuellement, mais je la trouve hyper chère, même des années après, et j’aimerais bien un p’tit upgrade. (Bon Ok, c’est contradictoire

-
@duJambon a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
ce sera surement à cause du dolby vision 2, mais pour le moment, rien ne semble être dans les cartons.
C’est bien dommage.
Je vais faire mes tests -
@djuza413 a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
@Violence a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
- J’utilise la Freebox POP
Bof. Elle fait le taf mais j’ai pas trop l’ergonomie et moins fluide que la shield. Et puis la télécommande de la POP…
Ba faut que je vois à l’utilisation. Idem pour la TV LG.
J’ai pas testé encore.Après la zapette, perso je m’en fous, je lui demande juste 4 flèches, retour arrière et OK.
Après je pourrais prendre celle de mon Odroid C2 avec Flirc aussi -
@djuza413 a dit dans Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu :
Beaucoup d’utilisateurs espèrent un nouveau modèle mais pour le moment ras. Vraiment je la recommande.
J’en fais partie.
J’espère un nouveau modèle avec Hardware + récent qui peut être n’arrivera jamais. -
Perso, plusieurs choix s’offre à moi pour mon MC Kodi actuellement en remplacement de mon Odroid C2:
- J’attends un nouveau modèle Shield pour investir
- Je prends un Pi 5 8Gb ou 16Gb
- je prends un odroid C5
- J’utilise la Freebox POP
- J’utilise la LG C5
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
En santé, les erreurs par omissions des LLM sont nombreuses et dangereuses
[Topic Unique] La cale
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
Présentation Argali
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu
Au cœur des efforts déployés par Nvidia pendant 10 ans pour faire de la Shield TV l'appareil Android le plus à jour jamais conçu