OpenAI introduit une nouvelle API pour les conversations vocales naturelles

Lors de l’événement pour développeurs DevDay 2024, OpenAI présente la nouvelle API Realtime. Celle-ci prend en charge des dialogues oraux naturels dans six voix différentes.

Pendant l’événement d’OpenAI à San Francisco, l’entreprise d’IA a révélé quatre mises à jour importantes de l’API pour les développeurs. Une des plus importantes est l’API Realtime. Cette API prend en charge des échanges oraux naturels d’une voix à une autre, en s’appuyant sur six tonalités différentes. Elle est disponible en bêta publique pour les développeurs.

Realtime API

À DevDay 2024, OpenAI annonce quatre nouvelles API pour développeurs, dont l’API Realtime est la plus importante. Cette API soutient les dialogues oraux entre voix, avec six voix prédéfinies. Avec cela, les développeurs peuvent intégrer des fonctionnalités dans leurs applications, similaires au mode vocal avancé de ChatGPT. Cette API est disponible en version bêta publique.

Selon OpenAI, l’API Realtime peut optimiser le processus de développement des assistants vocaux. Au départ, les développeurs devaient recourir à différents outils pour la reconnaissance vocale, le traitement du texte et la conversion de texte en voix. Avec la nouvelle API, ils peuvent gérer l’ensemble du processus en une seule fois.

Parallèlement, l’OpenAI introduit deux nouvelles API pour aider les développeurs à équilibrer les performances et les frais de création d’applications d’IA. Avec la « Model Distillation », les développeurs peuvent perfectionner des modèles plus petits en fonction de la sortie de modèles plus avancés. De plus, la « Prompt Caching » peut accélérer l’inférence en se souvenant des invités couramment utilisés. Enfin, « Vision Fine-tuning » permet aux développeurs d’adapter GPT-4o en donnant à la fois des images et du texte personnalisés.

Évènement développeur

L’évènement annuel des développeurs d’OpenAI a eu lieu lundi à San Francisco. Cet événement est exclusivement sur invitation. Le PDG d’OpenAI, Sam Altman, a opté cette année pour une approche mondiale. Cet évènement est organisé à plusieurs endroits et ne dure qu’une seule journée. Les prochaines villes sont Londres (30 octobre) et Singapour (21 novembre).

newsletter

Abonnez-vous gratuitement à ITdaily !

Category(Required)
This field is for validation purposes and should be left unchanged.