Google lance Gemini 3 : « le modèle d’IA le plus intelligent »

Google lance Gemini 3 : « le modèle d’IA le plus intelligent »

Google annonce Gemini 3, le modèle d’IA le plus intelligent selon l’entreprise. Le modèle doit exceller dans les domaines du raisonnement, des capacités multimodales et du développement.

Google présente avec Gemini 3 un nouveau modèle d’IA qui, selon l’entreprise, surpasse considérablement son prédécesseur. Le modèle traite non seulement le texte, mais aussi l’image, l’audio, la vidéo et le code dans une approche multimodale unique avec un nombre maximum d’un million de tokens.

Au sein de la nouvelle famille Gemini 3, Google lance Gemini 3 Pro en version préliminaire dans différents produits Google. Gemini 3 promet des capacités multimodales, un meilleur raisonnement et un partenariat actif pour les développeurs. Gemini 3 Pro apparaîtra comme option dans l’application Gemini au niveau mondial. Deep Think n’est pour l’instant disponible que pour les testeurs aux États-Unis.

Performances améliorées

Selon Google, Gemini 3 Pro est le modèle le plus puissant de la série Gemini à ce jour. Il obtient de meilleurs résultats que son prédécesseur Gemini 2.5 Pro sur tous les benchmarks d’IA importants, notamment LMArena, GPQA et MathArena.

Dans le domaine des benchmarks multimodaux, le modèle atteint notamment 87,6 % sur Video-MMMU et 72,1 % sur SimpleQA Verified, ce qui, selon Google, indique une plus grande fiabilité pour les informations factuelles.

Le modèle peut combiner et traiter le texte, l’image, la vidéo, l’audio et le code. Selon Google, il peut ainsi gérer des tâches plus complexes, comme l’analyse d’articles scientifiques, la génération de visualisations et même l’élaboration de programmes d’entraînement personnalisés basés sur des images vidéo.

Deep Think

En outre, Google ajoute un nouveau mode à Gemini 3 : Deep Think. Ce mode se concentre sur la résolution de problèmes plus complexes grâce à des capacités de raisonnement améliorées et une compréhension multimodale.

Selon Google, Gemini 3 Deep Think dépasse les performances déjà élevées de Gemini 3 Pro. Le modèle a obtenu 41 % sur Humanity’s Last Exam sans assistance et 93,8 % sur GPQA Diamond, un benchmark axé sur les questions de connaissances avancées.

De plus, le modèle a obtenu 45,1 % sur ARC-AGI-2 (y compris l’exécution de code), un test qui évalue la capacité de résolution de problèmes des modèles d’IA en termes de raisonnement et de généralisation.

La fonction est actuellement disponible pour les testeurs de sécurité et sera déployée ultérieurement pour les utilisateurs de l’abonnement Google AI Ultra.

Pour les développeurs

Google Antigravity est une nouvelle plateforme de développement qui utilise des agents d’IA pour exécuter automatiquement des tâches logicielles complexes. La plateforme utilise Gemini 3 et offre aux développeurs un environnement de développement orienté tâches.

lire aussi

Gemini 2.5 surpasse presque toutes les équipes humaines dans un concours de programmation

Antigravity associe les fonctions de raisonnement et de programmation de Gemini 3 à un environnement de développement intégré. Les agents d’IA sont capables d’écrire, d’exécuter et de valider du code de manière autonome dans cet environnement. Ils ont un accès direct à l’éditeur, au terminal et au navigateur pour gérer les processus logiciels de bout en bout.

Outre Gemini 3 Pro, qui constitue le modèle de raisonnement central, la plateforme utilise également Gemini 2.5 Computer Use pour l’interaction avec le navigateur et le modèle de traitement d’images Nano Banana (Gemini 2.5 Image).