Le successeur du modèle R1 devra encore attendre.
Selon deux sources anonymes de The Information, une pénurie de GPU Nvidia freine la production du modèle R2 de DeepSeek.
R2 se fait attendre
Il y a quelques mois, le chinois DeepSeek a surpris le monde de l’IA avec son modèle R1, entraîné sur cinquante mille GPU Nvidia Hopper. 10.000 d’entre eux étaient des puces H100, 10.000 autres des puces H800 et 3.000 des puces H20. Le modèle a performé aussi bien que les modèles de pointe à une fraction du coût. Il est rapidement devenu évident que la sécurité laissait à désirer et que le fonctionnement interne suscitait des inquiétudes.
Depuis les restrictions d’exportation imposées par les États-Unis vers la Chine, il est difficile d’obtenir ces GPU H20. Ceux déjà en Chine sont pleinement utilisés par les clients de DeepSeek. Le modèle R1 serait utilisé par des entreprises et des agences gouvernementales chinoises, ce qui réduit rapidement la capacité H20 chez DeepSeek même.
Où est la solution ?
Sans puissance de calcul supplémentaire, le modèle R2 ne peut pas s’améliorer et R1 rencontre également des problèmes. L’utilisation croît plus rapidement que le stock de puces disponible, ce qui peut entraîner des performances moindres. Les alternatives chinoises comme Huawei s’avèrent insuffisamment puissantes et ne fonctionnent pas avec le logiciel CUDA de Nvidia.
Alors que DeepSeek faisait initialement fureur, il semble maintenant perdre son élan par rapport à ses rivaux américains tels que OpenAI et Anthropic.