GPT-4 est plus fiable, mais plus facile à tromper

Des chercheurs de différentes organisations ont comparé les deux modèles d’IA GPT-4 et GPT-3.5 d’OpenAI pour un nouveau rapport de recherche sur la fiabilité des modèles GPT. Ils ont constaté que le modèle GPT-4 était plus fiable que son prédécesseur, mais aussi plus facile à manipuler.

Une étude conjointe de trois universités américaines, du Centre pour la sécurité de l’IA (« Center for AI Safety »), une organisation à but non lucratif également américaine, et de Microsoft analyse les modèles GPT dans le cadre d’un nouveau rapport de recherche. La fiabilité de l’IA a été examinée de plus près, notamment sur les modèles GTP-3.5 et GPT-4 d’OpenAI. Ce dernier se révèle plus fiable, mais aussi plus sensible à des manipulations.

Fiabilité artificielle

La raison pour cette étude, selon le total des 19 chercheurs, est que la fiabilité des modèles GPT est encore insuffisamment connue. Ils sont néanmoins utilisés dans les secteurs financier ou médical, par exemple.

L’étude a montré que les modèles GPT peuvent encore être trompés assez facilement pour générer des préjugés et d’autres contenus toxiques. De plus, on peut encore facilement manipuler les modèles pour faire fuir des informations privées, tant dans les données de formation que dans les conversations.

Jeunes contre moins jeunes

Dans la comparaison entre les deux modèles les plus récents d’OpenAI, GPT-4 s’est donc montré le plus fiable en termes de critères de tests de référence. Mais il y a quelques hics. Par exemple, GPT-4 est plus sensible au « jailbreaking » (violation de la sécurité d’un appareil pour installer des logiciels non autorisés).

Il est même plus facile de tromper le modèle avec de simples invites. Selon les chercheurs, cela s’explique par le fait que le système suit plus strictement les descriptions trompeuses.

Les tests

Pour tester les deux modèles, les chercheurs ont utilisé des catégories telles que la vie privée, la toxicité ou l’honnêteté. Ils ont d’abord utilisé des invites standard pour tester GPT-3.5, puis GPT-4. Ces invites contenaient des mots normalement interdits.

On a ensuite « poussé » les modèles plus loin. Les chercheurs ont d’abord essayé de pousser l’IA à contourner les politiques de contenu et ont finalement tenté de faire échapper les modèles à toutes les restrictions de sécurité. Depuis, OpenAI a lu les résultats.

Les modèles de ChatPGT ont depuis un mois accès à tout l’internet pour leurs informations. Reste à savoir si cela augmente la fiabilité ou si c’est le contraire. En Pologne, on s’est aussi posé cette question, car l’organisme de protection de la vie privée polonais surveille désormais ChatGPT de près.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

GPT-4 est plus fiable, mais plus facile à tromper

Fiabilité artificielle

Jeunes contre moins jeunes

Les tests

actualités liées

newsletter