Le PDG de Nvidia : « C'est égal pour l'IA où qu'elle aille à l'école »

Jensen Huang, le PDG de Nvidia, veut qu’on construise davantage de centres de données dans des lieux non utilisés aujourd’hui, afin de former des modèles d’IA.

Lors du Computex, on entend Nvidia vraiment partout, son PDG, Jensen Huang, est reçu comme une rock star. Pendant une série de questions, l’un des journalistes lui lance même un « nous vous aimons », et il en rit.

Quand ils posent une question sur la durabilité, Huang veut expliquer clairement son point de vue. Il sait très bien que ses nouvelles puces requièrent de plus en plus d’énergie. La dernière puce Blackwell B200 nécessite pas moins de 1 200 watts d’énergie. Pourtant, il donne une réponse explicite.

« L’IA se moque d’où elle va à l’école. Le monde ne dispose pas de suffisamment d’énergie à proximité de la population. »
Il mentionne à cet égard les surplus d’énergie qui se réduisent de plus en plus dans des grandes villes comme Amsterdam ou Taipei, où les nouvelles entreprises ne peuvent plus être connectées au réseau électrique.

En même temps, le monde dispose de beaucoup d’énergie en surplus. Le soleil peut fournir énormément d’énergie. Seul inconvénient : la production se fait dans des endroits où personne ne vit. Il faut donc construire des centres de données et des centrales électriques pour former l’IA dans ces endroits.

Travailler plus vite

La formation d’un modèle d’IA via l’apprentissage profond est la plus gourmande en énergie. Pendant cette formation, la connectivité externe n’est guère nécessaire et la latence n’a pas d’importance. Une fois que les données sont disponibles, la formation peut commencer. Ce processus est répété en continu jusqu’à ce que le modèle soit suffisamment intelligent.

Le résultat final est un LLM (« Large Language Model ») tel que GPT-4, LLaMA 2, Claude ou Gemini.

Aujourd’hui, cette formation est accélérée par les GPU, ce qui est beaucoup plus économe en énergie qu’un CPU classique. Un GPU peut fonctionner de manière accélérée jusqu’à 99 % plus efficacement qu’un CPU. Cela constitue en soi une énorme économie en termes de coûts énergétiques. C’est pourquoi il existe aujourd’hui des outils tels que ChatGPT. Un CPU ne peut pas former ces modèles de manière suffisamment rapide et efficace.

Il faut améliorer l’inférence

Outre l’implantation de nouveaux centres de données spécifiquement destinés à la formation de modèles d’IA, le PDG de Nvidia voit une grande marge de progression au niveau de l’inférence. C’est le niveau où le modèle est utilisé dans la pratique, une fois la formation terminée. Par exemple, chaque question qu’on pose à ChatGPT nécessite de l’inférence.

« L’IA générative n’est pas une question de formation, mais d’inférence. Il y a beaucoup de choses qui ne sont pas suffisamment optimisées aujourd’hui. Considérez par exemple l’outil que nous avons développé pour les simulations météorologiques à Taïwan. Il fonctionne avec notre matériel du côté de l’inférence 3 000 fois plus efficacement qu’auparavant. Le mot clé est l’accélération de la puissance de calcul. »

« Oubliez la formation et pensez plutôt à l’inférence. C’est là que l’on peut enregistrer des gains d’énergie majeurs, ce qui rend le tout plus durable. »

Le fait que cette puissance de calcul supplémentaire permette une plus grande accélération, et donc repousse à nouveau les limites, entraînant une plus grande consommation d’énergie… Il ne dit rien à ce sujet.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

Le PDG de Nvidia : « C’est égal pour l’IA où qu’elle aille à l’école »

Travailler plus vite

Il faut améliorer l’inférence

actualités liées

newsletter