AWS re:Invent 2025 à Las Vegas est placé sous le signe de ce que le fournisseur de cloud considère lui-même comme la prochaine grande étape de la transformation IA : « l’IA agentique ».
Plus de 60 000 participants au Venetian et des millions de spectateurs en ligne, même pour la première fois via Fortnite, sont témoins de la vision ambitieuse qu’AWS présente cette année : l’avenir du logiciel est basé sur les agents. Le PDG Matt Garman explique : « Nous sommes à un point de bascule… Les assistants IA cèdent la place aux agents IA qui exécutent et automatisent des tâches pour vous. C’est là que les entreprises commencent enfin à tirer une valeur matérielle. »
Cette vision n’est absolument pas nouvelle : pratiquement toute entreprise technologique disposant d’une offre de plateforme proclame l’émergence de l’IA basée sur les agents depuis un an déjà. AWS tente de clarifier lors de re:Invent quel rôle elle peut et veut jouer dans cette histoire.
Les agents IA comme nouvelle couche
La présentation principale du Dr Swami Sivasubramanian, VP IA agentique chez AWS, constitue le cœur du contenu de l’événement. Il illustre l’évolution des chatbots classiques vers des agents entièrement autonomes avec un exemple : un chatbot vous dit ce que vous devez examiner si vos visiteurs de site web diminuent à cause d’un bug, tandis que les agents exécutent réellement les tâches.

« Les agents IA peuvent mener activement des recherches, consulter des données, détecter des erreurs et proposer et implémenter des solutions. » Cela donne selon lui un sentiment de liberté aux développeurs : construire quelque chose qui ne fait plus seulement réagir, mais agit de lui-même.
Pourtant, il y a peu de projets qui atteignent la production. Garman le reconnaît et note que les entreprises construisent souvent de magnifiques prototypes qui « n’atteignent jamais la ligne d’arrivée » parce qu’ils ne sont pas suffisamment sûrs, contrôlables ou évolutifs. Martin Elwin, Directeur technologique chez AWS, dit également que pratiquement tous les DSI travaillent avec l’IA, mais que la majorité n’obtient pas encore la valeur qu’elle attendait. Cela vient selon lui du fait qu’elles commencent souvent de manière beaucoup trop technique ou ne pensent pas à partir des problèmes qu’elles rencontrent.
Bedrock Agent Core : de la production au produit final
AWS tente de résoudre cela avec Bedrock Agent Core, une plateforme qui doit faciliter la construction, la sécurisation et la surveillance des agents IA. Swami souligne qu’un agent n’a vraiment de valeur que lorsqu’il fait plus que raisonner intelligemment. Un agent doit avoir de la mémoire, un accès d’identité sécurisé et des capacités d’observation fiables. Ce n’est qu’alors qu’un agent peut prendre des décisions correctes de manière autonome.
Il avertit que « les développeurs ne peuvent pas résoudre ce qu’ils ne peuvent pas voir » : sans ces possibilités de surveillance, de débogage et de test, un agent reste imprévisible. C’est pourquoi les agents doivent être largement évalués, testés et surveillés avant d’aller vers les clients.
Citation
La nouvelle mémoire épisodique joue un grand rôle : les agents doivent non seulement se souvenir de ce qui s’est passé auparavant, mais aussi pourquoi c’est pertinent. Swami donne un exemple simple de sa propre vie : quand il voyage seul, il planifie son départ vers l’aéroport différemment que quand il voyage avec ses enfants. Un agent doit donc non seulement se souvenir qu’il réserve un vol, mais aussi dans quelles circonstances : solo ou en famille, pressé ou pas pressé, voyage léger ou lourd.
Un bon agent reconnaît automatiquement ce contexte et adapte ses choix en conséquence. Cela fait la différence entre un système qui ne fait que ressasser des informations et un agent qui comprend vraiment ce que l’utilisateur essaie de faire.
lire aussi
AWS annonce de nouvelles innovations IA : Nova, Nova Forge et Novellas
De plus, AWS annonce de nouvelles capacités :
- Agent Core Policies pour diriger le comportement sans limiter complètement l’autonomie.
- Agent Core Evaluations, avec lesquelles les entreprises peuvent simuler des milliers de scénarios pour détecter la dérive et les comportements inattendus avant qu’un agent ne soit mis en ligne.
L’ingénieur distingué d’AWS Marc Brooker souligne que les agents réussis ne doivent pas seulement recevoir de bonnes invites, mais qu’il s’agit surtout de sélectionner soigneusement les outils, d’avoir une politique claire et des interfaces fiables. Trop d’outils ou des actions mal décrites rendent les agents imprévisibles.
Nouvelle infrastructure
Les agents IA nécessitent une puissance de calcul à une échelle inédite. AWS mise fortement cette année sur l’innovation d’infrastructure. Trainium3 est la nouvelle puce d’AWS qui alimente les Ultraservers, les serveurs AWS pour entraîner l’IA. Garman raconte que les plus grandes configurations combinent 144 puces en un seul noyau de calcul avec des centaines de pétaflops de puissance. Il affirme qu’AWS rend ainsi possible une nouvelle catégorie de charges de travail agentiques « que vous ne trouvez nulle part ailleurs ».
La puce est immédiatement disponible pour les clients et est déjà utilisée intensivement par AWS elle-même pour faire fonctionner des modèles Bedrock à grande échelle.
AI Factory : puissance IA dans son propre centre de données
AWS introduit également l’ AI Factory, une sorte de pile gérée par AWS que les entreprises peuvent faire fonctionner dans leur propre centre de données, incluant des clusters Trainium, des GPU Nvidia et des services comme Bedrock et SageMaker. Selon Garman, l’AI Factory répond surtout aux besoins de conformité et de souveraineté des entreprises européennes : elles veulent déployer l’IA, mais seulement si elles ont le contrôle sur leurs données.
Nous voulons que leurs données restent là où les clients le déterminent.
Martin Elwin, Directeur technologique AWS Europe du Nord, confirme la demande de souveraineté sur la base de conversations avec les clients : la souveraineté numérique et la localisation des données sont des priorités absolues, surtout dans le Benelux. Il pointe la combinaison de l’architecture Nitro et le prochain Cloud souverain européen comme réponse à ces exigences.
Une petite remarque à ce sujet est le fait que les fournisseurs de cloud américains ne peuvent jamais vraiment offrir une souveraineté complète. Ils sont en effet liés au Cloud AI Act, avec lequel les États-Unis peuvent obliger AWS à transmettre des données, même lorsqu’elles se trouvent dans un centre de données AWS européen.
Nouveaux modèles frontières
Un élément important de la stratégie IA d’AWS sont les nouveaux modèles. C’est pourquoi la famille de modèles Nova est étendue. Nova a selon AWS un fort rapport prix-performance, une faible latence et des capacités multimodales. Nova 2 obtient différentes variantes pour le raisonnement, la conversation et l’inférence efficace. Les modèles sont intégrés dans Bedrock et optimisés pour le matériel propre d’Amazon, comme Trainium.
Pour rendre les modèles encore plus accessibles, AWS lance également Nova Forge, une plateforme qui donne accès aux points de contrôle des modèles Nova. Ce sont des versions sauvegardées d’un modèle à un point donné du processus d’entraînement. Elles contiennent souvent des paramètres et des informations et paramètres supplémentaires. De plus, il y a Transform, un ensemble d’outils avec lesquels les entreprises peuvent facilement convertir leurs propres données en agents personnalisés. Cela aide les entreprises à moderniser les charges de travail existantes et à les rendre prêtes à l’emploi plus rapidement.
Le choix de modèle devient un avantage stratégique
AWS souligne qu’il n’existera jamais un seul modèle qui résout tous les problèmes. Garman dit que les clients veulent justement combiner différents modèles pour rendre leurs agents plus flexibles. Bedrock prend en charge une large gamme de modèles, notamment Meta Llama, Mistral, Nvidia et Amazon Nova.
Le directeur produit de Hugging Face Jeff Boudier voit la même tendance. Il qualifie AWS de « plus ouvert » des grands fournisseurs de cloud en ce qui concerne le support de milliers de modèles ouverts et l’encouragement de la liberté de choix pour les entreprises. Selon lui, les clients veulent de plus en plus combiner des modèles pour différentes tâches : « il n’y a pas un modèle qui peut tout faire ».
Les agents IA sont l’avenir
AWS se positionne lors de re:Invent 2025 comme architecte d’une nouvelle ère logicielle. Le cloud n’est plus la destination finale, mais la couche de départ pour des systèmes IA autonomes qui raisonnent, se souviennent et exécutent. Avec Bedrock Agent Core, Trainium3, Nova et l’AI Factory, AWS prévoit une plateforme sur laquelle les entreprises peuvent non seulement construire des agents, mais aussi (enfin) les déployer de manière sûre et évolutive.
