Meta, la société mère de Facebook, construit actuellement un énorme superordinateur d’IA avec l’aide de systèmes Nvidia DGX A100. La machine devrait devenir la plus puissante de son genre.
Meta veut construire le superordinateur d’IA le plus puissant du monde avec le AI Research SuperCluster (RSC). Une fois terminé, le système combinera 16 000 GPU Nvidia A100 avec 4 000 processeurs AMD Epyc Rome 7742. Chaque nœud de calcul individuel est un système Nvidia DGX A100 avec deux CPU et huit GPU. Au total, RSC contiendra 2 000 nœuds. Le superordinateur est collé à l’interconnexion Infiniband de Nvidia Quantum, qui a une capacité de 200 Go/s.
Meta prévoit que son RSC sera en mesure d’offrir cinq exaflops de puissance de calcul à précision mixte (FP16 et FP32). Cela fait du cluster plus ou moins un superordinateur exaflopique. Après tout, Nvidia et la société mère de Facebook se concentrent sur des « benchmarks » spécifiques à l’IA, et non sur les « benchmarks » généraux utilisés pour déterminer officiellement la puissance de traitement d’un système pour une place dans le Top 500.
Élargir
Le système RSC existe déjà avec 760 nœuds DGX-A100, représentant 1 895 pétaflops de performance de calcul d’IA. Meta va élargir le superordinateur à l’ensemble du système dans les mois à venir. L’entreprise de Mark Zuckerberg espère utiliser le superordinateur pour former des modèles d’IA très avancés, capables notamment de prendre en charge la traduction en temps réel. En outre, Meta souhaite utiliser le Research SuperCluster pour des recherches liées à la RA.
Meta compte sur le partenaire de Nvidia, Penguin Computing, pour construire le superordinateur. Elle déploie progressivement l’ensemble de l’infrastructure. Penguin fournira à terme au cluster un exaoctet de stockage super rapide avec une bande passante de 16 téraoctets par seconde. Pour cela, l’entreprise fait appel à la technologie de stockage de Pure Storage.