Aller directement au contenu
  • Accueil
  • Catégories
    • Toutes les catégories
    • Planète Warez
      Présentations
      Aide & Commentaires
      Réglement & Annonces
      Tutoriels
    • IPTV
      Généraliste
      Box
      Applications
      VPN
    • Torrent & P2P
    • Direct Download et Streaming
    • Autour du Warez
    • High-tech : Support IT
      Windows, Linux, MacOS & autres OS
      Matériel & Hardware
      Logiciel & Software
      Smartphones & Tablettes
      Graphismes
      Codage : Sites Web, PHP/HTML/CSS, pages perso, prog.
      Tutoriels informatiques
    • Culture
      Actualités High-Tech
      Cinéma & Séries
      Sciences
      Musique
      Jeux Vidéo
    • Humour & Insolite
    • Discussions générales
    • Espace détente
    • Les cas désespérés
  • 0 Non lus 0
  • Récent
  • Mots-clés
  • Populaire
  • Meilleur vote
  • Résolu
  • Non résolu
  • Utilisateurs
  • Groupes
  • Faire un don
  • Wiki
Réduire
Logo

Planète Warez

,
  • Politique
  • Règlement
  • À propos
  • Annonces
  • Faire un don
  • Feedback
  • Team
  • Tutoriels
  • Bug Report
  • Wiki
    • Light
    • Default
    • Ubuntu
    • Lightsaber
    • R2d2
    • Padawan
    • Dim
    • FlatDark
    • Invaders
    • Metallic
    • Millennium
    • Leia
    • Dark
    • DeathStar
    • Starfighter
    • X-Wing
    • Sith Order
    • Galactic
ko-fi
  1. Accueil
  2. Culture
  3. Actualités High-Tech
  4. GPTBot : le webcrawler un peu trop envahissant d'OpenAI

GPTBot : le webcrawler un peu trop envahissant d'OpenAI

Planifié Épinglé Verrouillé Déplacé Actualités High-Tech
gptbotopenaiwebcrawler
1 Messages 1 Publieurs 119 Vues 1 Abonné
  • Du plus ancien au plus récent
  • Du plus récent au plus ancien
  • Les plus votés
Répondre
  • Répondre à l'aide d'un nouveau sujet
Se connecter pour répondre
Ce sujet a été supprimé. Seuls les utilisateurs avec les droits d'administration peuvent le voir.
  • Violenceundefined Hors-ligne
    Violenceundefined Hors-ligne
    Violence
    Admin PW Addict I.T Guy # Dev Team
    a écrit sur dernière édition par Violence
    #1

    OpenAI vient de dévoiler un robot d’exploration web, GPTBot, pour entraîner ses modèles sur les pages de n’importe quel site. Heureusement il est possible d’empêcher partiellement ou totalement son accès à un site.

    Il s’appelle GPTBot et pourrait devenir un cauchemar si vous ne le bloquez pas. Il s’agit d’un robot d’exploration web développé par OpenAI qui a pour but d’améliorer les modèles d’intelligence artificielle tels que GPT-4. Dans le détail, les pages Web explorées avec l’agent GPTBot « peuvent potentiellement être utilisées pour améliorer les futurs modèles et sont filtrées pour supprimer les sources qui nécessitent un accès au « paywall », sont connues pour recueillir des informations personnelles identifiables (PII) ou contiennent du texte qui enfreint nos politiques » indique OpenAI dans une page de documentation dédiée.

    Si autoriser GPTBot à accéder à votre site peut aider les modèles d’IA à devenir plus précis et à améliorer leurs capacités générales et leur sécurité, les risques liés sont tout aussi importants. En effet, début juillet, la firme a ainsi été obligée de fermer la fonction Browse avec Bing en version bêta après des dérives observées. « Nous avons appris que la version bêta de ChatGPT Browse pour Bing de Microsoft peut occasionnellement afficher du contenu d’une manière que nous ne souhaitons pas. Par exemple, si un utilisateur demande spécifiquement le texte intégral d’une URL, il se peut que cette demande soit satisfaite par inadvertance » a indiqué OpenAI. Plusieurs signalements ont ainsi été rapportés après que l’agent ait répondu aux utilisateurs avec le texte intégral en contournant les paywalls, mais aussi les paramètres de protection de la vie privée. Une histoire qui pourrait coûter très cher à la firme compte tenu des violations éventuelles en matière de sécurité et de confidentialité d’informations personnelles.

    Comment bloquer partiellement ou totalement l’accès de GPTBot aux sites

    C’est pourquoi la firme explique également comment interdire à GPTBot d’accéder à votre site. « Pour interdire à GPTBot d’accéder à votre site, vous pouvez ajouter GPTBot au fichier robots.txt de votre site » explique OpenAI, (User-agent: GPTBot ; Disallow: /).

    Pour ceux qui souhaiteraient plutôt personnaliser cet accès et autoriser GPTBot à accéder uniquement à certaines parties d’un site, voici le code à ajouter : User-agent: GPTBot ; Allow: /directory-1/ ; Disallow: /directory-2/.

    – Source :

    https://www.lemondeinformatique.fr/actualites/lire-l-ecosysteme-des-outils-d-ia-generative-ne-s-arrete-pas-a-chatgpt-91038.html

    V:\> █░░ SPR3AD TH3 C0D3 ░░█ ✌(◕‿-)✌
    ╚═ Admin, Dev et auteur de la plupart des bugs de PW…

    1 réponse Dernière réponse
    4

    Bonjour ! Vous semblez intéressé par cette conversation, mais vous n’avez pas encore de compte.

    Marre de refaire défiler les mêmes messages ? Créez un compte pour retrouver votre position, recevoir des notifications des nouvelles réponses, sauvegarder vos favoris et voter pour les messages que vous appréciez.

    Grâce à votre participation, ce message peut devenir encore meilleur 💗

    S'inscrire Se connecter
    Répondre
    • Répondre à l'aide d'un nouveau sujet
    Se connecter pour répondre
    • Du plus ancien au plus récent
    • Du plus récent au plus ancien
    • Les plus votés







    ©2026 planete-warez.net
    L'actualité Warez & underground en continu
    Icône café Faire un don
    Politique   RGPD  @dev  Sudonix
    • Se connecter

    • Vous n'avez pas de compte ? S'inscrire

    • Connectez-vous ou inscrivez-vous pour faire une recherche.
    • Premier message
      Dernier message
    0
    • Accueil
    • Catégories
      • Toutes les catégories
      • Planète Warez
        Présentations
        Aide & Commentaires
        Réglement & Annonces
        Tutoriels
      • IPTV
        Généraliste
        Box
        Applications
        VPN
      • Torrent & P2P
      • Direct Download et Streaming
      • Autour du Warez
      • High-tech : Support IT
        Windows, Linux, MacOS & autres OS
        Matériel & Hardware
        Logiciel & Software
        Smartphones & Tablettes
        Graphismes
        Codage : Sites Web, PHP/HTML/CSS, pages perso, prog.
        Tutoriels informatiques
      • Culture
        Actualités High-Tech
        Cinéma & Séries
        Sciences
        Musique
        Jeux Vidéo
      • Humour & Insolite
      • Discussions générales
      • Espace détente
      • Les cas désespérés
    • Non lus 0
    • Récent
    • Mots-clés
    • Populaire
    • Meilleur vote
    • Résolu
    • Non résolu
    • Utilisateurs
    • Groupes
    • Faire un don
    • Wiki