Meta dévoile un nouveau modèle de langage étendu qui peut fonctionner sur un seul GPU
-
Vendredi, Meta a annoncé un nouveau modèle de langage étendu (LLM) alimenté par l’IA appelé LLaMA-13B qui, selon lui, peut surpasser GPT-3 bien qu’il soit “10 fois plus petit”. Des modèles d’IA de plus petite taille pourraient conduire à l’exécution locale d’assistants linguistiques de type ChatGPT sur des appareils tels que des PC et des smartphones. Il fait partie d’une nouvelle famille de modèles de langage appelée “Large Language Model Meta AI”, ou LLAMA en abrégé.
Actuellement, une version simplifiée de LLaMA est disponible sur GitHub . Pour recevoir le code complet et les pondérations (les données d’entraînement « apprises » dans un réseau de neurones), Meta fournit un formulaire auquel les chercheurs intéressés peuvent demander l’accès. Meta n’a pas annoncé de plans pour une version plus large du modèle et des poids pour le moment.