Deutsche Bank signale un écart de coût de 65x entre les modèles d'IA frontière et les modèles ouverts

Deutsche Bank estime que Claude Fable 5 d'Anthropic coûte environ 3,25 $ par tâche, tandis que DeepSeek V4-Pro tourne à environ 5 cents — un écart de 65x que la banque compare à une tarification de « bien de statut » plutôt qu'à un reflet d'une réelle supériorité de performance.

« Les modèles frontière sont une supercar flambant neuve et rugissante ; les modèles open-weight sont un break familial d'occasion fiable », ont écrit les analystes dans un rapport daté du 20 juin. Pour environ 90 % des tâches courantes en entreprise, le modèle le moins cher fournit des résultats comparables, affirment-ils.

Claude Fable 5 obtient un score de 60 sur l'indice d'intelligence Artificial Analysis contre 44 pour DeepSeek V4-Pro. Le coût d'exécution de l'IA à un niveau de capacité fixe a diminué d'un facteur de 9x à 900x par an, note le rapport, tandis que le décalage entre les modèles fermés de pointe et la meilleure alternative open-weight s'est resserré, passant d'environ 12 mois à environ trois mois.

Cette découverte menace le pouvoir de fixation des prix des laboratoires frontière tels qu'Anthropic et OpenAI alors qu'ils se préparent à leurs introductions en bourse. Si les entreprises transfèrent 80 % de leurs charges de travail vers des modèles 99 % moins chers — comme l'a prédit le directeur général de Coinbase, Brian Armstrong, la semaine dernière — les modèles de revenus qui sous-tendent les valorisations de l'IA de plusieurs milliards de dollars sont confrontés à une pression structurelle.

Le fossé des coûts se creuse

L'écart n'est pas simplement une histoire États-Unis contre Chine. Le Muse Spark de Meta, le Nemotron 3 Ultra de Nvidia et le propre gpt-oss-120b d'OpenAI se situent tous dans la catégorie des bas coûts aux côtés de DeepSeek, selon le rapport. La véritable ligne de démarcation sépare les modèles frontière propriétaires des alternatives open-weight, et non les zones géographiques.

Les décisions de tarification d'Anthropic illustrent cette dynamique. Claude Fable 5, lancé le 9 juin, est facturé 10 $ par million de tokens en entrée et 50 $ par million de tokens en sortie — soit le double du prix d'Opus 4.8 et le modèle majeur le plus cher du marché. L'entreprise a ensuite basculé l'utilisation programmatique de Claude vers des crédits mesurés facturés aux tarifs complets de l'API le 15 juin, ce qui représente une augmentation de prix effective de 12x à 175x selon la tâche, selon les estimations citées dans le rapport.

Le passage des abonnements à tarif fixe à la facturation par token expose la sensibilité des entreprises aux coûts. Uber a épuisé l'intégralité de son budget 2026 pour les outils de codage IA dès avril et plafonne désormais chaque employé à 1 500 $ par outil et par mois en tokens. ServiceNow a épuisé son budget annuel Anthropic dans les premiers mois de 2026. Même Microsoft a annulé la plupart de ses licences internes Claude Code en mai et a transféré ses ingénieurs vers GitHub Copilot.

Le risque de réévaluation

Deutsche Bank établit un parallèle direct avec le « moment DeepSeek » du début 2025, lorsque les marchés ont réalisé qu'une capacité d'IA quasi-frontière pouvait être construite à un coût bien inférieur. Ce choc a déclenché une forte vente massive des valeurs IA, bien que le marché ait ensuite rebondi grâce à la demande globale continue.

La prise de conscience actuelle pourrait s'avérer plus silencieuse mais plus durable, selon la banque. Si les modèles d'IA propriétaires ont été en partie tarifés et échangés comme des biens de statut — où un prix élevé est en soi une caractéristique — alors une réévaluation complète de leur rapport coût-efficacité sur le marché pourrait produire une seconde réévaluation plus profonde des actions IA.

Les recherches d'Epoch AI citées dans le rapport apportent une corroboration indépendante : l'écart de capacité en IA de pointe entre les États-Unis et la Chine est en moyenne d'environ sept mois, un écart qui correspond étroitement à celui entre les modèles propriétaires et open-weight. Les dimensions géopolitiques et commerciales du fossé de l'IA sont essentiellement le même gouffre, conclut le rapport.

Anthropic a bouclé un tour de financement de 65 milliards de dollars à une valorisation de 965 milliards de dollars fin mai, avec un chiffre d'affaires annualisé de 47 milliards de dollars, contre 9 milliards de dollars à la fin de l'année dernière. L'entreprise a tout intérêt à protéger les revenus dont dépend sa valorisation, note le rapport. Mais alors que des substituts viables prolifèrent — les tokens open-weight coûtent 8 à 100 fois moins cher que les modèles frontière — aucune entreprise n'a besoin de lier ses opérations à un seul fournisseur.

Les entreprises qui construisent des couches de routage agnostiques aux modèles, où chaque tâche est assortie au modèle le moins cher qui l'exécute de manière adéquate, utiliseront davantage d'IA pour moins d'argent et selon leurs propres termes. Les services achats des entreprises commencent déjà à réagir : les grandes entreprises ont dépensé 37 milliards de dollars en IA générative en 2025, dont plus de la moitié — 19 milliards de dollars — allant à la couche applicative plutôt qu'aux fournisseurs de modèles.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.