Z.ai open-sourcise GLM-5.2, battant GPT-5.5 en codage à 1/6e du coût

Le GLM-5.2 de Z.ai égalise ou bat GPT-5.5 d'OpenAI et Claude Opus 4.8 d'Anthropic sur des benchmarks de codage clés à une fraction du coût, tandis que sa licence open-source MIT permet aux entreprises de contourner les restrictions géographiques.

Z.ai a publié GLM-5.2, un modèle open-weights de 753 milliards de paramètres qui surpasse GPT-5.5 sur plusieurs benchmarks de codage à long horizon tout en facturant 1/6e du prix de l'API, intensifiant la concurrence sur le marché de l'IA de pointe.

« GLM-5.2 est le premier modèle open-weights à franchir la barre des 80 % sur Terminal-Bench, et bat tous les autres modèles ouverts disponibles », a déclaré l'équipe derrière Cline IDE sur X, annonçant une intégration dès le premier jour avec l'environnement de codage open-source.

Le modèle obtient 62,1 sur SWE-bench Pro, dépassant les 58,6 de GPT-5.5 et les 58,4 de son prédécesseur GLM-5.1. Sur FrontierSWE, qui teste l'accomplissement de tâches à long horizon, il atteint 74,4 %, soit moins d'un point derrière les 75,1 % de Claude Opus 4.8. Sa fenêtre de contexte d'un million de tokens — étendue par rapport aux 200 000 tokens de GLM-5.1 — est alimentée par une nouvelle architecture IndexShare qui réutilise le même indexeur sur quatre couches d'attention sparse, réduisant les FLOPs de calcul par token de 2,9 fois à longueur de contexte maximale.

Les prix de l'API commencent à 1,40 $ par million de tokens d'entrée et 4,40 $ par million de tokens de sortie, contre 5,00 $ et 30,00 $ pour GPT-5.5. La licence open-source MIT permet aux entreprises d'héberger le modèle localement, éliminant le verrouillage fournisseur et contournant les restrictions géographiques qui ont récemment bloqué l'accès étranger au Claude Fable 5 d'Anthropic après une directive américaine de contrôle des exportations.

Sur le benchmark crowdsourcé Design Arena, GLM-5.2 a pris la première place avec un score ELO de 1 360, battant même Claude Fable 5. Sur Code Arena, un système d'évaluation de développement front-end impliquant des tests à l'aveugle par des millions d'utilisateurs mondiaux, il a atteint le meilleur classement parmi tous les modèles disponibles. Le modèle introduit également des « Modes de Pensée » sélectionnables — un réglage « Max » pousse l'intelligence maximale en utilisant environ 85 000 tokens de sortie par tâche, tandis que « High » réduit de moitié la consommation de tokens avec une perte de performance minimale.

L'écosystème des développeurs a réagi rapidement. Kilo Code, Cline et Eigent AI ont tous confirmé un support dès le premier jour. Les niveaux d'abonnement pour le Plan de Codage GLM commencent à 12,60 $ par mois pour le niveau Lite, 50,40 $ pour Pro et 112,00 $ pour Max, chacun ciblant des charges de travail de dépôt progressivement plus lourdes.

Knowledge Atlas (02513.HK), la société mère de Z.ai cotée à Hong Kong, a grimpé de 0,7 % suite à l'annonce, avec un volume de ventes à découvert atteignant 92,75 millions de dollars — un ratio de vente à découvert de 2 % qui suggère un positionnement significatif des traders. CICC a relevé son objectif de cours de 39 % à 1 250 HKD, maintenant une notation de surperformance, tandis que JPMorgan a augmenté son objectif de 47 % à 1 400 HKD, citant la position de leader de l'entreprise en matière de capacités de codage.

Les implications concurrentielles dépassent les benchmarks. Alors que DeepSeek-V4-Pro facture 0,87 $ par million de tokens de sortie et GLM-5.2 à 4,40 $, l'écart entre les modèles open-weights et propriétaires s'est réduit au point que les principaux laboratoires pourraient fonctionner avec des « marges de 90 %+ », comme l'a soutenu l'observateur de l'IA Lisan al Gaib sur X. Pour les entreprises, la capacité à exécuter une IA de pointe sur une infrastructure souveraine sous une licence MIT sans restriction supprime un obstacle clé à l'adoption — en particulier pour les organisations dans les juridictions affectées par les contrôles américains à l'exportation.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.