« Gemini est moins performant que l'ancien ChatGPT »

Selon les chercheurs, le modèle Gemini de Google est quasiment aussi performant que l’ancien modèle GPT-3.5. La version payante de ChatGPT avec GPT-4 est meilleure.

Gemini, le nouveau LLM de Google, ne peut pas rivaliser avec les derniers modèles d’OpenAI. C’est ce que déclarent des chercheurs dans un article publié sur Arxiv.org. La recherche en question a été menée par la célèbre université Carnegie Mellon et la start-up BerriAI, dont le principal objectif est de faciliter l’accès à plusieurs modèles d’IA à l’aide d’invites. Cette recherche semble minutieuse et fiable, mais on attend toujours une révision par des collègues.

Tests approfondis

Les chercheurs ont comparé Gemini Pro et GPT-3.5 Turbo dans plusieurs disciplines, notamment la connaissance, le raisonnement, les mathématiques et la traduction. Pour chacun de ces tests, Gemini a été légèrement moins performant que l’ancien modèle GPT 3.5 Turbo. GPT 4 Turbo a obtenu des résultats bien meilleurs que les autres.

Les chercheurs ont expliqué leur méthode de test dans un article bien compréhensible. Ils ont notamment testé les connaissances des deux modèles à l’aide de 57 questions à choix multiples, dont les réponses de Gemini étaient les moins précises. Pour le raisonnement général, les modèles ont été testés sur 27 tâches, tirées d’une étude antérieure. Là encore, Gemini ne faisait pas bonne figure. En particulier dans une question où un objet est échangé entre différentes entités (une histoire dans laquelle différents amis achètent différents livres et les transmettent ensuite), Gemini a perdu le fil.

Gemini a peut-être une bosse de maths alors ? Pas non plus, selon les chercheurs. Les LLM ont dû résoudre des problèmes de différents niveaux et, une fois de plus, Gemini était le raté.

Bosse des langues

Gemini excelle dans les langues. Les modèles ont été soumis à 20 tâches de traduction et, grosso modo, le modèle de Google a perdu la course ici aussi, mais le score a été serré. Dans huit des 20 cas, Gemini a surpassé GPT 3.5 et même GPT 4.

Le bilan de l’étude est clair : Gemini n’est pas aussi performant que le dernier modèle d’OpenAI. La différence est énorme. À ce stade, Google n’a donc pas rattrapé son retard et OpenAI reste le champion. Nous ne croyons pas que ces résultats surprennent Google. Pourtant, lors de la présentation du modèle, la démo s’est avérée être une simple mise en scène. Voilà qui manque de confiance.

GPT-3.5 est disponible gratuitement via ChatGPT et reste le meilleur modèle gratuit du moment. GPT-4 est bien meilleur et sans équivalent pour le moment. Pour l’utiliser, il faut un abonnement payant à ChatGPT.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

« Gemini est moins performant que l’ancien ChatGPT »

Tests approfondis

Bosse des langues

actualités liées

newsletter