« Hey ChatGPT ! » OpenAI dévoile sa nouvelle version d’un chatbot réputé

Outre le nouveau modèle d’IA, OpenAI a également présenté une version de bureau de ChatGPT. Avec ce modèle, GPT-4o, on peut passer des appels. Ainsi, ChatGPT pourrait devenir un sérieux concurrent des assistants vocaux comme Amazon (Alexa), Apple (Siri) et Google.

Selon l’agence de presse Belga, le nouveau système peut traiter des informations à partir de commandes vocales, communiquer par une voix humaine avec l’utilisateur et traduire entre différentes langues. « C’est la première fois que nous progressons réellement en termes de facilité d’utilisation », a déclaré Mira Murati, responsable de la technologie chez OpenAI. Selon l’entreprise, le nouveau modèle GPT-4o sera également disponible pour les utilisateurs gratuits.

Plus vite et plus fort

La directrice d’OpenAI a indiqué que le nouveau modèle était beaucoup plus rapide et qu’il offrait davantage de possibilités en termes de texte, de vidéo et d’audio. L’objectif ultime est de laisser les utilisateurs discuter par vidéo avec ChatGPT. Le o de GPT-4o signifie omni. Grâce à ce nouveau modèle, ChatGPT peut traiter 50 langues mieux et plus rapidement. Il sera également disponible via l’API d’OpenAI, donc les développeurs pourront immédiatement commencer démarrer.

Lors de la présentation de GPT-4o, OpenAI a illustré le potentiel audio du modèle. Selon le chercheur Mark Chen, le modèle peut même percevoir les émotions et n’est pas gêné si un utilisateur interrompt une conversation. L »équipe OpenAI précise que le modèle peut également analyser les expressions faciales pour ensuite commenter les émotions ressenties par la personne.

Phase de test

Dans les semaines à venir, OpenAI testera le mode vocal de GPT-4o. Par la suite, l’application sera mise à la disposition de tous les utilisateurs. Les abonnés payants bénéficieront d’un accès plus rapide à l’outil. Selon l’OpenAI, le modèle répondrait aux messages vocaux ultra-rapidement. Son temps de réponse de 320 millisecondes en moyenne serait comparable au temps de réponse d’un humain dans une conversation.

GPT-4o pourrait même devenir un concurrent de GitHub Copilot (Microsoft). Le modèle peut résoudre des équations mathématiques et aider à écrire du code. Le moment choisi pour cette présentation est intéressant, car Google organise aujourd’hui sa conférence annuelle pour les développeurs, Google I/O. On attend des annonces sur de nouvelles fonctionnalités liées à l’intelligence artificielle. Il y a quelques mois, Google a déjà montré comment son logiciel d‘IA Gemini peut traiter des informations vocales et visuelles.

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.
retour à la maison