Gemini, l’ambitieux projet d’IA de Google, serait en dernière phase de développement pour un lancement avant la fin de l’année.
Depuis la croissance phénoménale de ChatGPT, la recherche sur l’IA chez Google et ses différentes équipes a connu un sérieux essor. Depuis Google Brain, le chatbot Bard a été lancé et DeepMind, possédé par Google depuis plusieurs années, associe même l’IA à la robotique. Ces deux équipes ont été réunies pour le projet commun Gemini AI.
Initialement, Google semblait vouloir lancer Gemini cette année, mais cette date a été repoussée à janvier 2024 au plus tôt. Selon The Information, le modèle d’IA réalise pour l’instant encore des scores tout à fait insuffisants sur les requêtes non anglophones. Le PDG Sundar Pichai aurait donc décidé qu’il vaut mieux retarder le lancement.
Sûrement le destin
En juin, on a déjà parlé de Gemini, quand le projet était encore en plein développement. Entre-temps, la famille d’IA récemment recomposée de Brain et DeepMind chez Google a travaillé durement ; Gemini a été et continue d’être formé intensivement dans pas mal de domaines. Même le cofondateur Sergey Brin participe activement au projet. Google est donc sérieux.
On ne veut pas juste faire concurrence à OpenAI avec les capacités de l’IA, mais on veut faire beaucoup mieux et aller bien au-delà. Gemini n’est pas seulement un grand modèle de langage (LLM), mais devrait aussi générer des images d’IA contextuelles.
Mais ce n’est pas tout ! Le modèle devrait aussi pouvoir lire les organigrammes et permettre de contrôler les logiciels avec la voix. Grâce à l’immense répertoire de vidéos de Google sur YouTube, Gemini disposerait même de (transcriptions des) vidéos (transcriptions) dans le dossier de formation. Tout cela dans un cadre légal, bien sûr.
Selon la source (anonyme) au sein du projet, Gemini sera bientôt intégré à des produits comme Google Docs et les développeurs devront payer pour y avoir accès. Suite à l’intégration dans de différents produits, on peut s’attendre aussi à une appli.