Nouvelle formation pour l'IA d'OpenAI pour mettre fin aux hallucinations

Bien que l’intelligence artificielle soit de plus en plus performante, les réponses des chatbots sont encore souvent bourrées d’erreurs monumentales. L’OpenAI mène actuellement des recherches pour améliorer cette situation.

Depuis la création de ChatGPT d’OpenAI, la popularité des chatbots d’intelligence artificielle connaît un essor sans précédent en très peu de temps. Les modèles d’apprentissage avec lesquels l’IA se forme sont vastes, mais pas sans défaut ni omniscients. Souvent, des systèmes comme ChatGPT ou Google Bard composent eux-mêmes quelque chose quand ils ne connaissent pas la réponse et « vendent » ces fabrications comme des informations correctes.

Quelques exemples

Chez Google Bard, la présentation l’a immédiatement démontré au grand jour. Le système a prétendu que le télescope spatial James Webb avait pris la toute première photo d’une planète située en dehors de notre système solaire. En fait, cet honneur revient au Very Large Telescope de l’Observatoire européen austral au Chili, qui a pris une photo d’une exoplanète en 2004. C’était près de 17 ans avant le lancement de la sonde James Webb.

Inventer de toutes pièces numériques peut aussi avoir des conséquences juridiques. Récemment, un avocat new-yorkais a pensé renforcer les preuves en faveur de son équipe, dans le procès de son client contre une compagnie aérienne, en présentant au tribunal un bon nombre de cas similaires dans un dossier volumineux. Mais, il avait utilisé ChatGPT pour créer ce dossier et le système semblait avoir inventé tous les cas. Le juge a immédiatement ordonné une audience contre l’avocat pour déterminer les sanctions. On attend encore le résultat de l’affaire, qui est toujours en cours. Mais le plaignant est certainement moins à l’aise après cette débâcle.

Le PDG d’OpenAI met en garde le monde entier contre les inconvénients de l’intelligence artificielle, en s’appuyant partiellement sur ces exemples. Cela n’a pas empêché l’entreprise de lancer entre-temps une application officielle ChatGPT pour iPhone.

Solution

Pour éviter ces problèmes, l’OpenAI va développer de nouvelles méthodes de formation plus efficaces. Le principe consiste à récompenser l’IA pour les résultats fiables et à décourager les résultats indésirables. L’idée n’est pas de se limiter au résultat final, mais de l’appliquer à chaque étape ; « supervision du processus » au lieu de « supervision du résultat ». Cette approche rendrait le raisonnement du système plus transparent.

Pour les chercheurs de l’OpenAI, cette méthode a de nombreux avantages. En contrôlant l’ensemble du processus et pas seulement le résultat, l’IA raisonne beaucoup moins selon le principe « la fin justifie les moyens ». La supervision humaine à chaque étape aide à mieux interpréter le processus, selon les chercheurs. L’inconvénient de cette méthode est qu’elle ralentit la formation de l’IA. On ne sait pas comment le système sera récompensé, mais ce ne sera sûrement pas avec un bonbon.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

Nouvelle formation pour l’IA d’OpenAI pour mettre fin aux hallucinations

Quelques exemples

Solution

actualités liées

newsletter