Imagen 2 est la dernière itération du modèle d’IA de Google qui convertit des textes en images. La qualité de l’image et les réponses sont plus précises, mais aucun détail sur la formation du modèle n’a été fourni.
Il y a quelques jours, Google a déjà dévoilé ses modèles d’IA les plus puissants à ce jour, Gemini et Gemini Pro, en réponse au GPT-4 d’OpenAI. Le lancement suivant est Imagen 2. Ce modèle d’IA génère des images à partir d’invites textuelles. Contrairement à la version précédente d’Imagen, cette version mise à jour offre une meilleure qualité d’image et peut fournir des réponses plus détaillées. On ignore toutefois quelles données Google a utilisées pour former ce modèle.
Meilleure qualité d’image et plus intelligente
Imagen 2 a été développé à l’aide de la technologie de Google DeepMind, le laboratoire d’IA phare de Google. Imagen 2 peut générer et modifier une image à partir d’invites textuelles.
Non seulement la qualité des images est meilleure, mais le modèle AI introduit également de nouvelles options pour l’affichage de textes et de logos, telles qu’une image avec un texte superposé. Imagen 2 peut aussi générer des emblèmes, des lettres et des logos abstraits. Après avoir été créés, ces logos peuvent être collés sur des produits, des vêtements ou des cartes de visite.
Enfin, Imagen 2 est aussi plus intelligent que son prédécesseur. Ce modèle a été formé pour mieux comprendre les invites longues et descriptives et pour donner des réponses détaillées aux questions portant sur des éléments particuliers d’une image. Google souligne la capacité de compréhension multilingue d’Imagen 2. Par exemple, il peut convertir une invite dans une langue en une autre langue (par exemple, un logo).
Techniques de formation du modèle inconnues
Malgré les améliorations du modèle d’IA, Google ne divulgue pas les données avec lesquelles il a formé Imagen 2. Du coup, les créateurs qui ont contribué involontairement à l’ensemble de données ne peuvent pas se désinscrire ou demander une compensation.
La propriété intellectuelle est un souci essentiel en matière d’utilisation de l’IA générative. Certaines entreprises, comme Stability AI et OpenAI, permettent aux créateurs de se désinscrire des ensembles de données de formation. Mais Google n’offre pas encore cette possibilité.