• 4 Votes
    1 Messages
    68 Vues

    Vous avez vu Voice Engine d’OpenAI ? C’est un modèle d’IA qui est capable de générer des voix synthétiques ultra-réalistes à partir d’un simple échantillon audio de 15 secondes. Seulement 15 secondes, oui !

    Concrètement, ça veut dire qu’avec cette IA, on peut créer des voix qui ressemblent à s’y méprendre à celles de vraies personnes. Genre on donne un petit extrait de notre voix, et hop, l’IA peut générer un discours entier qui sonne exactement comme nous. C’est à la fois fascinant et un peu flippant, vous trouvez pas ?

    OpenAI sont à la pointe de la recherche dans le domaine et ils nous pondent régulièrement des trucs de malade comme Sora. Concernant Voice Engine, ils ont développé la techno fin 2022 et l’ont intégré dans leur API de synthèse vocale ainsi que dans les fonctionnalités vocales de ChatGPT.

    – Voici les 15 secondes de vraie voix :

    https://korben.info/app/uploads/2024/03/age-of-learning-reference.mp3

    – Et voici l’audio qui a été généré à partir de ça :

    https://korben.info/app/uploads/2024/03/age-of-learning-physics.mp3

    Mais attention, comme un grand pouvoir implique de grandes responsabilités (coucou Peter !), OpenAI joue la carte de la prudence. Ils sont bien conscients que cette technologie pourrait être utilisée à des fins pas très catholiques, genre pour créer des deepfakes audio et induire les gens en erreur. Du coup, ils la déploient pour l’instant à petite échelle, juste auprès de quelques partenaires de confiance.

    Et ces partenaires, ils en font quoi de Voice Engine ?

    Eh bien figurez-vous qu’ils développent des applications plutôt cools ! Par exemple, Age of Learning l’utilise pour générer des contenus audio éducatifs avec des voix naturelles et expressives. Ou encore HeyGen qui s’en sert pour traduire des vidéos dans différentes langues en conservant la voix du locuteur d’origine. D’ailleurs c’est ce que j’utilise pour ma chaine Youtube en anglais et je peux vous dire que ça coûte une couille. Ça peut aussi aider les personnes non-verbales à communiquer avec une voix unique grâce à Livox. Et même redonner la parole à des patients ayant perdu l’usage de la voix, comme le fait l’institut Norman Prince Neurosciences de Lifespan.

    Rassurez-vous, OpenAI a mis en place des garde-fous, comme l’interdiction d’utiliser Voice Engine pour imiter quelqu’un sans son consentement, l’obligation d’obtenir l’accord explicite du locuteur original, ou encore le watermarking des contenus générés pour pouvoir en tracer l’origine. Ils suggèrent également d’abandonner progressivement l’authentification vocale comme mesure de sécurité, mais également d’explorer des réglementations qui permettraient de protéger l’usage des voix dans l’IA, de sensibiliser le public aux deepfakes et de développer des techniques pour tracer l’origine des contenus audio et visuels.

    Bref, Voice Engine c’est à la fois excitant et inquiétant. Ce que je vois, c’est que ça ouvre des perspectives folles en termes d’applications, mais ça soulève aussi pas mal de questions sur l’avenir.

    Je vous invite à checker l’article d’OpenAI qui détaille leur approche avec plein d’exemples.

    – Sources :

    https://www.theverge.com/2024/3/29/24115701/openai-voice-generation-ai-model

    https://korben.info/openai-devoile-voice-engine-ia-generatrice-voix-synthetiques.html

    –> Punaise déja que la réglementation des IA est quasi inexistante alors avec ce truc :blink:

  • 0 Votes
    3 Messages
    111 Vues

    Ha ben je comprends mieux pourquoi ça ne fonctionnait pas hier ! Et dire qu’on m’a accusé d’avoir mal formulé ma question 🙄

  • 4 Votes
    1 Messages
    53 Vues

    OpenAI vient de dévoiler un robot d’exploration web, GPTBot, pour entraîner ses modèles sur les pages de n’importe quel site. Heureusement il est possible d’empêcher partiellement ou totalement son accès à un site.

    Il s’appelle GPTBot et pourrait devenir un cauchemar si vous ne le bloquez pas. Il s’agit d’un robot d’exploration web développé par OpenAI qui a pour but d’améliorer les modèles d’intelligence artificielle tels que GPT-4. Dans le détail, les pages Web explorées avec l’agent GPTBot « peuvent potentiellement être utilisées pour améliorer les futurs modèles et sont filtrées pour supprimer les sources qui nécessitent un accès au « paywall », sont connues pour recueillir des informations personnelles identifiables (PII) ou contiennent du texte qui enfreint nos politiques » indique OpenAI dans une page de documentation dédiée.

    Si autoriser GPTBot à accéder à votre site peut aider les modèles d’IA à devenir plus précis et à améliorer leurs capacités générales et leur sécurité, les risques liés sont tout aussi importants. En effet, début juillet, la firme a ainsi été obligée de fermer la fonction Browse avec Bing en version bêta après des dérives observées. « Nous avons appris que la version bêta de ChatGPT Browse pour Bing de Microsoft peut occasionnellement afficher du contenu d’une manière que nous ne souhaitons pas. Par exemple, si un utilisateur demande spécifiquement le texte intégral d’une URL, il se peut que cette demande soit satisfaite par inadvertance » a indiqué OpenAI. Plusieurs signalements ont ainsi été rapportés après que l’agent ait répondu aux utilisateurs avec le texte intégral en contournant les paywalls, mais aussi les paramètres de protection de la vie privée. Une histoire qui pourrait coûter très cher à la firme compte tenu des violations éventuelles en matière de sécurité et de confidentialité d’informations personnelles.

    Comment bloquer partiellement ou totalement l’accès de GPTBot aux sites

    C’est pourquoi la firme explique également comment interdire à GPTBot d’accéder à votre site. « Pour interdire à GPTBot d’accéder à votre site, vous pouvez ajouter GPTBot au fichier robots.txt de votre site » explique OpenAI, (User-agent: GPTBot ; Disallow: /).

    Pour ceux qui souhaiteraient plutôt personnaliser cet accès et autoriser GPTBot à accéder uniquement à certaines parties d’un site, voici le code à ajouter : User-agent: GPTBot ; Allow: /directory-1/ ; Disallow: /directory-2/.

    – Source :

    https://www.lemondeinformatique.fr/actualites/lire-l-ecosysteme-des-outils-d-ia-generative-ne-s-arrete-pas-a-chatgpt-91038.html

  • 2 Votes
    4 Messages
    130 Vues

    @michmich

    Il a tout de même vécu 5 siècles, les Big Tech ont encore quelques beaux jours devant elles :ahah: