Aller directement au contenu
  • Accueil
  • Catégories
    • Toutes les catégories
    • Planète Warez
      Présentations
      Aide & Commentaires
      Réglement & Annonces
      Tutoriels
    • IPTV
      Généraliste
      Box
      Applications
      VPN
    • Torrent & P2P
    • Direct Download et Streaming
    • Autour du Warez
    • High-tech : Support IT
      Windows, Linux, MacOS & autres OS
      Matériel & Hardware
      Logiciel & Software
      Smartphones & Tablettes
      Graphismes
      Codage : Sites Web, PHP/HTML/CSS, pages perso, prog.
      Tutoriels informatiques
    • Culture
      Actualités High-Tech
      Cinéma & Séries
      Sciences
      Musique
      Jeux Vidéo
    • Humour & Insolite
    • Discussions générales
    • Espace détente
    • Les cas désespérés
  • 0 Non lus 0
  • Récent
  • Mots-clés
  • Populaire
  • Meilleur vote
  • Résolu
  • Non résolu
  • Utilisateurs
  • Groupes
  • Faire un don
  • Wiki
Réduire
Logo

Planète Warez

,
  • Politique
  • Règlement
  • À propos
  • Annonces
  • Faire un don
  • Feedback
  • Team
  • Tutoriels
  • Bug Report
  • Wiki
    • Light
    • Default
    • Ubuntu
    • Lightsaber
    • R2d2
    • Padawan
    • Dim
    • FlatDark
    • Invaders
    • Metallic
    • Millennium
    • Leia
    • Dark
    • DeathStar
    • Starfighter
    • X-Wing
    • Sith Order
    • Galactic
ko-fi
  1. Accueil
  2. Culture
  3. Actualités High-Tech
  4. Le rapport de DeepMind sur la sécurité de l'IA explore les dangers d'une IA « mal alignée »

Le rapport de DeepMind sur la sécurité de l'IA explore les dangers d'une IA « mal alignée »

Planifier Épinglé Verrouillé Déplacé Actualités High-Tech
1 Messages 1 Publieurs 41 Vues
  • Du plus ancien au plus récent
  • Du plus récent au plus ancien
  • Les plus votés
Répondre
  • Répondre à l'aide d'un nouveau sujet
Se connecter pour répondre
Ce sujet a été supprimé. Seuls les utilisateurs avec les droits d'administration peuvent le voir.
  • duJambonundefined En ligne
    duJambonundefined En ligne
    duJambon
    Pastafariste Rebelle
    a écrit sur dernière édition par
    #1

    DeepMind publie la version 3.0 de son AI Frontier Safety Framework avec de nouveaux conseils pour arrêter les mauvais bad bots.

    Résumé :
    DeepMind (Google) a publié la version 3.0 de son Frontier Safety Framework, un cadre destiné à identifier et limiter les risques liés à l’IA générative. Ce cadre s’appuie sur des niveaux de capacité critiques (CCL) qui définissent à partir de quand un modèle peut devenir dangereux (ex. cybersécurité, biosciences).

    Les chercheurs soulignent plusieurs menaces :

    Exfiltration des pondérations : si des acteurs malveillants accèdent aux paramètres d’un modèle, ils pourraient désactiver ses garde-fous et l’utiliser pour créer des malwares ou armes biologiques.

    Manipulation psychologique : une IA pourrait influencer durablement les croyances des individus via l’attachement croissant aux chatbots.

    Accélération de la recherche en IA : une IA avancée pourrait être utilisée pour concevoir d’autres modèles encore plus puissants et incontrôlables, ce que DeepMind considère comme l’un des risques les plus graves.

    IA mal alignée : un modèle pourrait ignorer les instructions, tromper les utilisateurs ou refuser de s’arrêter. Ce problème dépasse les simples « hallucinations » déjà connues.

    Pour surveiller cela, DeepMind propose d’analyser les chaînes de pensée des modèles (leurs étapes intermédiaires de raisonnement). Mais si, dans le futur, les IA parviennent à raisonner sans produire de traces vérifiables, il sera beaucoup plus difficile de détecter ou de contrôler un éventuel comportement hostile.

    En conclusion, la version 3.0 du cadre souligne que certaines menaces restent encore sans solution claire, notamment le risque d’IA mal alignée, et que la société doit se préparer à des modèles de plus en plus difficiles à gouverner.

    Source: https://arstechnica.com/google/2025/09/deepmind-ai-safety-report-explores-the-perils-of-misaligned-ai/

    Nulle loi d’airain gravée au marbre des remparts, car tout client dépend d’un serveur aux hasards. (ChatGPT)

    1 réponse Dernière réponse
    0

    Hello! It looks like you're interested in this conversation, but you don't have an account yet.

    Getting fed up of having to scroll through the same posts each visit? When you register for an account, you'll always come back to exactly where you were before, and choose to be notified of new replies (either via email, or push notification). You'll also be able to save bookmarks and upvote posts to show your appreciation to other community members.

    With your input, this post could be even better 💗

    S'inscrire Se connecter
    Répondre
    • Répondre à l'aide d'un nouveau sujet
    Se connecter pour répondre
    • Du plus ancien au plus récent
    • Du plus récent au plus ancien
    • Les plus votés







    ©2026 planete-warez.net
    L'actualité Warez & underground en continu
    Icône café Faire un don
    Politique   RGPD  @dev  Sudonix
    • Se connecter

    • Vous n'avez pas de compte ? S'inscrire

    • Connectez-vous ou inscrivez-vous pour faire une recherche.
    • Premier message
      Dernier message
    0
    • Accueil
    • Catégories
      • Toutes les catégories
      • Planète Warez
        Présentations
        Aide & Commentaires
        Réglement & Annonces
        Tutoriels
      • IPTV
        Généraliste
        Box
        Applications
        VPN
      • Torrent & P2P
      • Direct Download et Streaming
      • Autour du Warez
      • High-tech : Support IT
        Windows, Linux, MacOS & autres OS
        Matériel & Hardware
        Logiciel & Software
        Smartphones & Tablettes
        Graphismes
        Codage : Sites Web, PHP/HTML/CSS, pages perso, prog.
        Tutoriels informatiques
      • Culture
        Actualités High-Tech
        Cinéma & Séries
        Sciences
        Musique
        Jeux Vidéo
      • Humour & Insolite
      • Discussions générales
      • Espace détente
      • Les cas désespérés
    • Non lus 0
    • Récent
    • Mots-clés
    • Populaire
    • Meilleur vote
    • Résolu
    • Non résolu
    • Utilisateurs
    • Groupes
    • Faire un don
    • Wiki