Intel lance de nouveaux GPU axés sur l’inférence IA et les stations de travail, et apporte également des mises à jour pour ses accélérateurs IA Gaudi 3.
Lors du Computex, Intel élargit son portefeuille de GPU « s » et d’accélérateurs. Le fabricant introduit les GPUs Arc Pro B60 et B50. Ces puces sont destinées aux stations de travail professionnelles et, selon Intel, conçues en tenant compte des charges de travail IA.
Public cible diversifié
Les deux modèles sont basés sur l’architecture Xe2 et offrent des fonctionnalités telles que les cœurs IA Intel Xe Matrix Extensions (XMX) et le ray tracing avancé. Ils sont destinés, entre autres, aux applications d’architecture, d’ingénierie et de construction, ainsi qu’aux tâches d’inférence IA. Les GPU sont pris en charge par divers fournisseurs de logiciels indépendants et disposent de pilotes compatibles avec Windows et Linux.
Le B60 dispose de 24 Go de mémoire tandis que le B50 se contente de 16 Go. En ce qui concerne l’IA, ce n’est pas très impressionnant. 16 Go ne suffisent certainement pas pour charger de grands LLM. L’Arc Pro B50 semble donc être davantage un GPU de station de travail généraliste.
En outre, Intel dévoile une plateforme de station de travail basée sur Intel Xeon, nom de code Project Battlematrix. Cette plateforme peut contenir jusqu’à huit GPU Arc Pro B60 avec une capacité totale de mémoire vidéo de 192 Go. Cela permet d’exécuter des modèles d’IA de taille moyenne avec un maximum de 150 milliards de paramètres.
Plus d’Intel Gaudi 3
Intel étend également son offre d’accélérateurs IA avec davantage d’options Gaudi 3. L’accélérateur est désormais disponible sous forme de carte PCIe et dans des systèmes à l’échelle du rack. Les cartes PCIe prennent en charge l’inférence IA évolutive et conviennent aussi bien aux petites entreprises qu’aux grandes sociétés. Elles peuvent gérer divers modèles d’IA, notamment Llama 3.1 8B jusqu’à Llama 4 Scout et Maverick. Les cartes seront disponibles au second semestre 2025.
Les solutions à l’échelle du rack peuvent contenir jusqu’à 64 accélérateurs par rack et disposent de 8,2 To de mémoire à haute bande passante. Intel opte pour une conception ouverte et modulaire indépendante d’un seul fournisseur.
Concurrence difficile
Intel tente de s’emparer d’une part de ce marché lucratif avec ses GPU et accélérateurs. C’est difficile, car l’ensemble du secteur de l’IA est dominé par Nvidia. Ce fabricant dispose non seulement des puces les plus performantes, mais les soutient également avec un écosystème logiciel qui est de fait la norme aujourd’hui.
Intel détient encore une part de marché élevée dans les serveurs et les stations de travail, en particulier avec Xeon. Les solutions combinées sont donc certainement pertinentes, bien que le fabricant manque ici aussi d’élan. La position de challenger est en effet déjà occupée par AMD, qui tente d’offrir une alternative intéressante à Nvidia avec ses puces Epyc et ses accélérateurs Instinct. À cet égard, AMD a acquis une plus grande crédibilité, notamment grâce à l’utilisation de ses accélérateurs dans les supercalculateurs les plus puissants du monde.