Gemini 2.5 bat presque toutes les équipes humaines dans un concours de programmation

Gemini 2.5 surpasse presque toutes les équipes humaines dans un concours de programmation

Gemini 2.5 a obtenu de meilleurs résultats dans un concours de résolution de problèmes algorithmiques complexes que près de 130 équipes humaines.

Google a fait participer son modèle d’IA Gemini 2.5 au Concours international de programmation universitaire (ICPC), où il a remporté une médaille d’or. Gemini a résolu dix des douze énigmes algorithmiques. Seules quatre des 139 équipes humaines y sont parvenues. Selon Google, il s’agit d’« une étape importante vers l’IA générale ».

Plus rapide et plus intelligent que presque tout le monde

Pendant le concours, les participants humains ont bénéficié d’une avance de 10 minutes. Ensuite, Gemini 2.5 Deep Think a commencé, une version qui pouvait « réfléchir » plus longtemps pendant la session de cinq heures. En 45 minutes, Gemini avait déjà soumis huit solutions correctes et après près de 12 heures, le compteur affichait dix réponses correctes. Gemini a terminé deuxième au classement général.

Un point culminant remarquable était le Problème C : un problème complexe qu’aucune équipe humaine n’a résolu, mais que Gemini a pu résoudre. L’IA a trouvé la bonne solution après trente minutes grâce à la programmation dynamique et une fonction de recherche imbriquée.

Et maintenant ?

Selon Google, cela démontre que l’IA ne peut pas seulement résumer des textes, mais aussi maîtriser la logique et les mathématiques complexes. L’entreprise voit des applications dans des secteurs comme la conception de semi-conducteurs et la biotechnologie, où le raisonnement approfondi est crucial. Des tests internes montreraient que Gemini 2.5 aurait également remporté l’or lors des éditions précédentes de l’ICPC (2023 et 2024).

Google ne communique pas de chiffres sur la consommation d’énergie, mais souligne qu’une IA aussi puissante coûte cher à faire fonctionner. Néanmoins, l’entreprise pense qu’une IA qui peut déjà résoudre des problèmes incroyablement complexes à ce stade peut justifier ces coûts.