Anthropic、Claude Sonnet 5を発表——Opus 4.8比60%安の価格でエージェントAI性能はフラッグシップに迫る

Anthropicの新たなミッドティアモデルは、フラッグシップ級のエージェント性能を約半額のコストで実現する。

Anthropicは火曜日、ミッドティアAIモデル「Claude Sonnet 5」を発表した。知識業務ベンチマークにおいてフラッグシップモデルのOpus 4.8と同等の性能を発揮しながら、トークンあたりのコストを60%削減。企業向けAI市場における価格競争が激化する中、同社は新規株式公開（IPO）に向けて準備を進めている。

AI搭載コードエディタ「Cursor」の共同創業者Sualeh Asif氏は、「Claude Sonnet 5を使えば、エージェントは計画を維持し、当社の規則に従い、クリーンなマルチステップの変更を出荷する。しかも効率的なコストで実現できる」と述べた。

Sonnet 5は、エージェンティックコーディングのベンチマークであるSWE-bench Proで63.2%を記録。Sonnet 4.6の58.1%から向上し、Opus 4.8の69.2%に迫るスコアだ。知識業務評価のGDPval-AA v2では、フラッグシップモデルを上回る1,618点（Opus 4.8は1,615点）を達成。価格は8月31日までの導入期間中、入力100万トークンあたり2ドル、出力100万トークンあたり10ドルからとなっており、Opus 4.8の5ドルおよび25ドルと比較して大幅に割安だ。本モデルは更新版トークナイザーを採用し、コンテンツに応じて入力を1.0〜1.35倍に拡張可能。Anthropicはこの変更について、導入期間中は「おおむねコスト中立」になるよう調整されていると説明している。

今回の発表は、Anthropicが今年後半に予想されるIPOに向けて急ピッチで準備を進める中で行われた。同社は6月1日にS-1を秘密裏に提出。5月には評価額9650億ドルでシリーズHによる650億ドルの資金調達を実施し、売上高実行率は470億ドルに達している。Sonnetティアが実験的な利用を本格的なプロダクション規模の収益に転換できるかどうかは、公開市場の投資家にとって重要な指標となる。

エージェント能力が新たな基準に

Sonnet 5が強調する自律的なタスク実行（計画立案、ツール使用、マルチステップワークフローの完了）は、AI業界全体の幅広いシフトを反映している。OpenAIは先週、同様のサブエージェント機能を備えたGPT-5.6 Solをプレビュー公開。Googleが5月にリリースしたGemini 3.5 Flashも、人間の入力を最小限に抑えたエージェンティックツールとして位置づけられている。もはや差別化要因は、どの企業がエージェントモデルを構築できるかではなく、本番環境での大規模展開に十分な低コストで提供できるかどうかに移っている。

初期アクセスパートナーは、Sonnet 5が従来のモデルでは停滞していた複雑なタスクを完了したと報告している。ZapierのシニアエンジニアDaniel Shepard氏は、本モデルがSalesforceのアカウント層を更新し、エンタープライズの連絡先にローンチアナウンスを送信するという2段階の自動化作業を完了したと述べ、「以前のバージョンでは途中で止まってしまっていた」と語った。別のコーディング評価であるTerminal-Bench 2.1では、Sonnet 5が80.4%を記録し、Sonnet 4.6の67.0%を上回り、Opus 4.8の82.7%に迫った。

安全性のトレードオフとIPOのストーリー

Anthropicによると、Sonnet 5は幻覚（ハルシネーション）と追従（シコファンシー）の発生率が従来モデルより低く、プロンプトインジェクション攻撃への耐性も向上している。しかし、Mozillaと共同で作成したFirefox 147のエクスプロイト開発評価では、Sonnet 5の部分的な成功率は13.2%と、Sonnet 4.6の8.8%から上昇。ただし、いずれのモデルも実用的なエクスプロイトは生成しなかった。Opus 4.8は68.8%、制限付きのMythos 5は88.4%を記録した。AnthropicはSonnet 5にリアルタイムのサイバーセキュリティ保護機能をデフォルトで有効化してリリースしており、Opus 4.7および4.8と同様の保護措置を講じている。

この価格戦略は、AnthropicのIPOストーリーにおいて二重の目的を果たす。同社は、低価格モデルが開発者による実験的な使用だけでなく、数千ものエンタープライズ顧客からの高ボリュームで継続的なAPI収益を生み出せることを示す必要がある。D.A. Davidsonのテクノロジー調査責任者Gil Luria氏はCNBCに対し、Anthropicは「フロンティアAIモデルでリードしているように見えるが、現在の使用の多くは試験や実験的なものであり、それが持続可能とは限らない」と述べた。

つい昨日、カリフォルニア州知事Gavin Newsom氏は、全州政府機関にClaudeを50%割引で提供し、無料の労働力トレーニングを実施する提携を発表した。これは、継続的な収益の基盤となり得る、持続可能で制度的な採用形態だ。Anthropicは、3月に評価額8520億ドルで1220億ドルを調達し、自社のIPOを目指すOpenAIや、Google、Meta、同様の機能を開発する資金力のあるアジアのAIスタートアップとの競争に直面している。

Anthropicの株式はまだ公開市場で取引されていない。同社のS-1が公開されれば、Sonnetティア（低価格だが高ボリューム）とOpusティア（高価格だが高マージン）のどちらが粗利益の大部分を牽引するかについて厳しい scrutiny（精査）を受けることになる。PitchBookのアナリストHarrison Rolfes氏がCNBCに語ったように、2026年のIPOウィンドウは「ドットコム時代以来、最も重要なIPOサイクルとなるか、あるいは公開市場がこれまで教えてきた中で最も高くつく『ストーリー対ファンダメンタルズ』の教訓となるかのどちらかだ」。

本記事は情報提供のみを目的としており、投資助言を構成するものではない。