Le nouveau Qwen3.7-Plus d'Alibaba fusionne la vision et le langage en un seul modèle agentique, défiant OpenAI et Google dans la course à la domination de l'IA multimodale.
Le nouveau Qwen3.7-Plus d'Alibaba fusionne la vision et le langage en un seul modèle agentique, défiant OpenAI et Google dans la course à la domination de l'IA multimodale.

Alibaba Group a publié Qwen3.7-Plus, un modèle agentique multimodal qui unifie la vision et le langage, alors que les géants technologiques chinois se disputent un marché mondial de l'IA où OpenAI affiche une valorisation de 852 milliards de dollars.
« Qwen3.7-Plus améliore les capacités vision-langage tout en conservant l'ensemble des capacités agentiques en codage, utilisation d'outils et workflows de productivité », a déclaré Alibaba via son compte WeChat Qwen.
Le modèle s'appuie sur la fondation textuelle de Qwen3.7, ajoutant la compréhension visuelle pour créer ce qu'Alibaba appelle un « agent hybride interactif multimodal ». Il conserve les capacités de son prédécesseur en matière de codage, d'utilisation d'outils et de tâches de productivité, tout en s'étendant au raisonnement vision-langage — un ensemble de fonctionnalités qui concurrence directement le GPT-4o d'OpenAI et le Gemini de Google, qui a dépassé les 750 millions d'utilisateurs réguliers, selon Google.
Ce lancement intensifie la concurrence dans le secteur chinois de l'IA, où Alibaba, Baidu et ByteDance s'efforcent d'égaler les leaders mondiaux. Alibaba Cloud, qui propose les modèles Qwen aux clients entreprises, pourrait voir son adoption augmenter à mesure que les entreprises recherchent l'IA multimodale pour des tâches allant de l'analyse documentaire à la gestion automatisée des workflows. Le marché mondial de l'IA a vu le nombre d'utilisateurs réguliers de ChatGPT atteindre 900 millions, selon OpenAI.
Le marché de l'IA multimodale s'intensifie alors que les rivaux se développent
La décision d'Alibaba intervient alors que l'industrie de l'IA entre dans sa quatrième année depuis l'explosion de l'IA générative dans le grand public. Le « vibe coding » — où les développeurs utilisent des invites en langage naturel pour générer du code — a gagné du terrain, et les entreprises de tous les secteurs ont adopté des workflows agentiques qui automatisent les tâches en plusieurs étapes. Les capacités agentiques de Qwen3.7-Plus le positionnent pour cette évolution, permettant au modèle d'utiliser des outils, d'écrire du code et d'exécuter des tâches de productivité de manière autonome.
L'approche multimodale répond à une limitation clé des modèles textuels uniquement : l'incapacité à traiter les images, les diagrammes et les données visuelles. En intégrant la vision et le langage, Qwen3.7-Plus peut analyser des graphiques, lire des documents avec des images intégrées et générer des réponses qui se réfèrent au contexte visuel — des capacités de plus en plus demandées par les clients entreprises dans les secteurs de la finance, de la santé et de la fabrication.
Les entreprises technologiques chinoises, y compris Huawei Technologies et Xiaomi, développent également leurs investissements dans l'IA alors que la concurrence s'intensifie dans tous les secteurs. La poussée plus large vers les produits alimentés par l'IA s'étend au-delà des logiciels : les expéditions de lunettes intelligentes compatibles avec l'IA ont bondi de plus de 300 % l'année dernière, atteignant 8,7 millions d'unités en 2025, selon Omdia, avec des projections dépassant les 15 millions d'unités cette année.
Implications d'investissement pour Alibaba et le secteur de l'IA
Les actions Alibaba sont négociées à la Bourse de New York sous le ticker BABA. L'entreprise a massivement investi dans les infrastructures d'IA, positionnant Qwen comme un modèle fondamental pour les entreprises et les communautés de développeurs à travers l'Asie. Avec Qwen3.7-Plus, Alibaba vise à capter une part des dépenses des entreprises en IA, alors que celles-ci passent des chatbots monomodaux aux agents capables de voir, lire et agir sur plusieurs types de données.
Les enjeux concurrentiels sont élevés. Le dernier tour de financement d'OpenAI valorise l'entreprise à 852 milliards de dollars, tandis que Gemini de Google a rassemblé plus de 750 millions d'utilisateurs réguliers. La famille Qwen d'Alibaba représente le plus sérieux concurrent chinois face à la domination américaine dans les modèles d'IA fondamentaux, aux côtés des offres d'Ernie de Baidu et de Doubao de ByteDance. Pour les investisseurs, la question clé est de savoir si Alibaba peut convertir la capacité de ses modèles en croissance des revenus cloud — un indicateur qui deviendra plus clair dans les prochains rapports de résultats.
Alibaba se négocie à environ 10 fois les bénéfices à terme, une décote par rapport à ses pairs technologiques américains, reflétant les risques géopolitiques et une croissance intérieure plus lente. Une réussite dans la monétisation de l'IA pourrait réduire cet écart, selon les analystes de Citi et Morgan Stanley qui ont cité les investissements d'Alibaba dans l'IA comme un moteur potentiel de réévaluation de l'action. Le prochain rapport trimestriel de l'entreprise fournira les premières données concrètes sur la question de savoir si Qwen3.7-Plus entraîne l'adoption par les entreprises et l'accélération des revenus cloud.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.