Nvidia introduit Spectrum-XGS Ethernet pour permettre à plusieurs centres de données dispersés de collaborer comme un seul environnement d’IA.
Nvidia souhaite relier des centres de données dispersés pour former d’énormes clusters. À cette fin, elle annonce lors du salon Hot Chips aux États-Unis Nvidia Spectrum-XGS Ethernet.
Au-delà des emplacements
Spectrum-XGS ajoute une couche de scale-across à l’architecture Spectrum-X existante. Les centres de données situés à différents endroits et connectés via Spectrum-XGS fonctionnent comme un seul cluster. Nvidia cite la gestion de la congestion en fonction de la distance, le contrôle précis de la latence et la télémétrie de bout en bout comme fonctions essentielles. La technologie doit accélérer la communication collective des GPU et maintenir la prévisibilité des performances sur de plus longues distances.
Spectrum-XGS est intégré à la plateforme Spectrum-X plus large, avec des commutateurs Spectrum-X et des SuperNIC ConnectX-8. La plateforme vise une densité de bande passante plus élevée et une latence plus faible que l’Ethernet standard dans les environnements d’IA multi-locataires. Selon Nvidia, les améliorations doublent presque les performances de la communication NCCL sur plusieurs nœuds et sites. Spectrum-XGS est disponible immédiatement dans le portefeuille Spectrum-X.
Évolution de Spectrum
Spectrum-XGS Ethernet s’appuie sur Spectrum-X, introduit en 2023, un Ethernet adapté au trafic d’IA. Les innovations photoniques de Spectrum-X Photonics et Quantum-X Photonics jettent les bases au sein d’un même site de centre de données. L’optique co-emballée dans les commutateurs offre des vitesses de port élevées et une meilleure efficacité. Cela augmente la bande passante et l’intégrité du signal pour les clusters d’IA avec de nombreux GPU.
Spectrum-XGS y ajoute une fonctionnalité de scale-across sur plusieurs sites. Le résultat doit être un seul cluster d’IA, réparti sur plusieurs sites. Nvidia annonce que des clients sont déjà prêts à connecter des centres de données les uns aux autres grâce à cette technologie.