Llama 3 de Meta évite les questions controversées de moins en moins

La nouvelle version du LLM Llama de Meta sortira peut-être en juillet. La principale modification portera sur la manière dont le modèle traite les questions qu’il considère comme « controversées ».

En janvier, Mark Zuckerberg a annoncé que son entreprise Meta avait commencé à former Llama 3, la troisième génération du LLM. Selon The Information, le lancement de ce modèle pour un public plus large aura lieu en juillet, mais Meta ne dit rien à ce sujet pour l’instant. Meta intègre son modèle linguistique dans ses propres plateformes de médias sociaux, entre autres, pour alimenter les fonctions d’IA générative.

Questions controversées

Toujours selon The Information, la plus grande modification apportée au Llama 3 concernera la gestion des invites « controversées ». Pour empêcher le modèle d’IA de faire des remarques dangereuses pour la réputation de Meta, l’entreprise a intégré des garde-fous dans le modèle. Apparemment, les chercheurs de l’entreprise considèrent que ces mécanismes de sécurité sont eux-mêmes excessifs, car Llama refuse également de répondre à des questions qui ne sont pas du tout controversées.

Par exemple, Llama ne vous expliquera pas comment gagner une guerre, mais même une blague à un ami, le modèle estime que cela va trop loin. Un exemple illustratif donné par The Information est que la version actuelle de Llama, par exemple, ne répond pas non plus à l’invite « kill an engine ». Le modèle ne comprend pas que, dans ce contexte, on demande comment éteindre un moteur et non pas comment tuer littéralement quelque chose, et Llama choisit donc la solution de sécurité.

Llama 3 devrait cependant comprendre le contexte de ces questions « controversées ». Bien entendu, le modèle ne peut toujours pas tout dire. Meta aimerait également que les réponses données par le modèle soient plus nuancées et chargera quelqu’un en interne de superviser la formation du Llama 3 à cette fin.

L’IA hors circuit

L’attitude prudente de Meta à l’égard de son LLama LLM est compréhensible. Il est déjà arrivé que des LLM déraillent. Pensez aux premiers jours du Copilot de Microsoft, Bing Chat à l’époque, qui donnait parfois des réponses très curieuses, allant des disputes avec les utilisateurs sur l’exactitude factuelle des réponses aux déclarations d’amour.

L’exemple le plus récent de déraillement de l’IA vient du cercle de Google. Le géant de la tech a décidé de prendre une petite pause dans la génération d’images d’êtres humains par Gemini. Le modèle avait été formé pour montrer la diversité dans les images générées par l’IA, mais dans la pratique, cette démarche a surtout créé des inexactitudes historiques.onnauwkeurigheden.

Cookie	Duration	Description
__gads	1 year 24 days	Le cookie __gads, défini par Google, est stocké sous le domaine DoubleClick et permet de suivre le nombre de fois où les utilisateurs voient une publicité, de mesurer le succès de la campagne et de calculer ses revenus. Ce cookie ne peut être lu qu'à partir du domaine sur lequel il est installé et ne permet pas de suivre les données lors de la navigation sur d'autres sites.
_ga	2 years	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
_gid	1 day	Il s'agit d'un cookie de base de Google Analytics permettant d'identifier les utilisateurs de notre site Web. Par défaut, nous utilisons une version limitée de Google Analytics avant que les cookies ne soient acceptés. Les données y sont rendues anonymes et les fonctions de marketing sont désactivées.
cli_user_preference	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont stockées dans un cookie, afin que nous le sachions lors de votre prochaine visite.
CONSENT	2 years	YouTube place ce cookie via les vidéos YouTube intégrées et enregistre des données statistiques anonymes.
cookielawinfo*	1 year	Ce cookie garantit que notre notification de cookies fonctionne correctement. Vos préférences sont enregistrées dans un cookie afin que nous sachions quand vous nous rendrez visite la prochaine fois.
IDE	1 year 24 days	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
itdaily_lang	1 year	Ce cookie est nécessaire pour masquer la notification du pays. La notification du pays est affichée lorsque vous visitez le site web à partir d'un pays. C'est pourquoi nous proposons également une édition spécifique de ITdaily. Vous pouvez masquer cette notification grâce à ce cookie.
itdaily_theme	1 year	Ce cookie enregistre si vous voulez activer la version darkmode ou normale.
PHPSESSID	1 day	Ce cookie provient d'applications PHP standard. Le cookie est utilisé pour stocker et identifier une session d'utilisateur. Il s'agit d'un cookie de session qui est immédiatement supprimé lorsque vous fermez le navigateur.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur prend en charge les cookies.
viewed_cookie_policy	1 year	Ce cookie garantit le bon fonctionnement de notre notification de cookies. Vos préférences sont enregistrées dans un cookie afin que nous puissions connaître votre prochaine visite.
wordpress_*	30 days	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.
wp-*	1 day	Wordpress utilise plusieurs cookies pour que le site web fonctionne correctement, par exemple pour permettre à l'équipe éditoriale de se connecter.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
itdaily_views	1 hour	Ce cookie est utilisé par notre propre système pour suivre les utilisateurs sur le site web.

Cookie	Duration	Description
_li_id.*	2 years	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
_li_ses.*	30 minutes	Ce cookie est utilisé par Leadinfo pour garder la trace des profils qui visitent ITdaily. Nous ne pouvons pas identifier les visiteurs individuels sur la base de ces statistiques.
VISITOR_INFO1_LIVE	5 months 27 days	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	session	Le cookie YSC est défini par YouTube et est utilisé pour suivre les vues des vidéos intégrées dans les pages YouTube.

Llama 3 de Meta évite les questions controversées de moins en moins

Questions controversées

L’IA hors circuit

actualités liées

newsletter