Meta dévoile un nouveau modèle de langage étendu qui peut fonctionner sur un seul GPU
-
Vendredi, Meta a annoncé un nouveau modèle de langage étendu (LLM) alimenté par l’IA appelé LLaMA-13B qui, selon lui, peut surpasser GPT-3 bien qu’il soit “10 fois plus petit”. Des modèles d’IA de plus petite taille pourraient conduire à l’exécution locale d’assistants linguistiques de type ChatGPT sur des appareils tels que des PC et des smartphones. Il fait partie d’une nouvelle famille de modèles de langage appelée “Large Language Model Meta AI”, ou LLAMA en abrégé.
Actuellement, une version simplifiée de LLaMA est disponible sur GitHub . Pour recevoir le code complet et les pondérations (les données d’entraînement « apprises » dans un réseau de neurones), Meta fournit un formulaire auquel les chercheurs intéressés peuvent demander l’accès. Meta n’a pas annoncé de plans pour une version plus large du modèle et des poids pour le moment.
Hello! It looks like you're interested in this conversation, but you don't have an account yet.
Getting fed up of having to scroll through the same posts each visit? When you register for an account, you'll always come back to exactly where you were before, and choose to be notified of new replies (either via email, or push notification). You'll also be able to save bookmarks and upvote posts to show your appreciation to other community members.
With your input, this post could be even better 💗
S'inscrire Se connecter