Alibaba dévoile une nouvelle génération de modèles de raisonnement d’IA open source.
L’entreprise technologique chinoise Alibaba a annoncé la série Qwen3 : un ensemble de modèles d’IA qui, selon l’entreprise, peut rivaliser avec, et parfois surpasser, les meilleurs modèles d’OpenAI et de Google.
De 0,6 à 235 milliards de paramètres
Les modèles de la famille Qwen 3 varient en taille, de 0,6 à 235 milliards de paramètres. Plus il y a de paramètres, meilleures sont les performances du modèle. La plupart seront bientôt disponibles en tant que modèles ouverts sur Hugging Face et GitHub. Les modèles hybrides combinent des temps de réponse rapides avec un raisonnement approfondi et offrent aux utilisateurs un “budget de réflexion”. Cela leur permet de configurer plus facilement des budgets spécifiques à chaque tâche. Certains modèles utilisent une architecture de “Mixture of Experts” (MoE) pour une répartition des tâches plus efficace.
Formation approfondie
Alibaba déclare dans son annonce que Qwen3 prend en charge 119 langues et a été entraîné sur 36 billions de tokens provenant de manuels, de questions-réponses, de fragments de code et de données synthétiques. Qwen3 excelle dans le suivi des instructions, l’appel d’outils et la copie de formats de données. Le plus grand modèle (Qwen-3-235B-A22B) surpasse de justesse des concurrents tels que OpenAI’s o3-mini et Google’s Gemini 2.5 Pro sur des benchmarks mathématiques, par exemple, mais n’est pas encore disponible publiquement.
L’émergence de séries de modèles développés en Chine comme Qwen exerce une pression sur l’Amérique pour développer une meilleure technologie d’IA. Selon les experts, ces modèles seront largement déployés, en particulier en Chine, malgré les restrictions américaines sur l’exportation de puces.
Qwen3 est déjà disponible via l’interface web Qwen Chat ou via l’application mobile.