2025年5月22日、Anthropicは「Claude 4」ファミリーとして、Claude Opus 4とClaude Sonnet 4を発表しました。これは同社にとって技術的な節目であり、フロンティアAIの実用化を一段と押し進める内容と位置づけられています。
Opus 4は長時間にわたる複雑作業やエージェント的ワークフローに強く、「コーディング能力」に関する各種評価で高いパフォーマンスを示したとされます。一方のSonnet 4は、前世代(Sonnet 3.7)比で応答性と指示追従性を強化し、日常ユースケースの即応に適した汎用モデルとして位置づけられています。
また、モデル提供にとどまらず、開発プラットフォーム(Anthropic API)やClaude Codeの強化、主要クラウド(Amazon Bedrock、Google Cloud Vertex AI)での提供拡大など、採用経路の多面化も図られています。
技術的ポイント
1. ハイブリッド思考とツール利用(Extended Thinking)
Claude 4は「即答モード」と「Extended Thinking(拡張思考)」を用途に応じて切り替え可能とされます。前者は高速応答、後者は多段階推論や外部ツール活用を前提とした深い思考を担い、ユースケースに応じた柔軟性を提供します。さらに、Web検索などのツールを並列活用し、推論と外部データを統合する設計が示されています。
2. 長時間タスク持続性とメモリ機構
Opus 4は数時間にわたるタスクの継続実行に強みを持つとされ、SWE‑benchやTerminal‑benchなどのベンチマークで高スコアを記録したとの報告があります。また、開発者が許可する場合に限り、ローカルファイルを用いた「メモリ」管理で長期タスクの一貫性を確保する仕組みも示されています。
3. Claude Codeと新API
Claude Codeは一般提供(GA)に移行し、GitHub Actions、VS Code、JetBrainsなどとの統合により、よりシームレスなコーディング支援を狙います。API面では、コード実行ツール、MCP(Model Context Protocol)コネクタ、Files API、プロンプトキャッシュ(最長1時間)などが案内され、エージェント構築の柔軟性向上が図られています。
4. 提供チャネルと価格の方向性
Opus 4/Sonnet 4はAnthropic APIに加え、Amazon Bedrock、Google Cloud Vertex AIでも提供される見込みです。価格は従来モデル帯に沿った水準が示され、例としてOpus 4が入力$15/出力$75(100万トークン単位)、Sonnet 4が$3/$15といった案内が流通しています。Sonnet 4の無料プラン対応についても報告があります(参考: 公式モデル概要 https://docs.anthropic.com/en/docs/about-claude/models/overview)。
5. ベンチマーク概況
Opus 4はSWE‑bench Verifiedで約72.5%、Terminal‑benchで約43.2%のスコアに言及があり、Sonnet 4もSWE‑benchで約72.7%といった報告が見られます。その他、Sec‑benchやGPQA Diamondなどでも優位性が示唆されています。
設計上のトレードオフ
- 速度と深い推論: 即答モードとExtended Thinkingの切替は柔軟だが、適切な使い分け判断が必要。
- プライバシーとメモリ: ファイルアクセスを伴うメモリ機能は有用だが、機密情報の扱いに注意。
- 価格と性能: Sonnet 4はコスト効率寄り、Opus 4はより深い推論に強み。
- 外部ツール依存: Web検索等により柔軟性は増すが、誤情報取り込みリスクに留意。
実運用の要点
- 開発環境: 外部ツール利用時はAPIクォータやアクセス制御の設計が重要。
- セキュリティ: Claude Codeやメモリ機能利用時の情報漏洩対策を徹底。
- コスト最適化: 長時間推論・エージェント運用では、プロンプトキャッシュやバッチ化でコスト管理。
- クラウド運用: Bedrock/Vertex AI等のデプロイ・権限・監査フローを事前設計。
まとめ
Claude 4ファミリーは、即応性と拡張思考を両立する設計で、コード生成・長時間タスク・エージェント運用などにおける有力な選択肢となり得ます。開発者は、ユースケースに応じてモードやツール活用を最適化しつつ、安全性とコストを両立させる設計が求められます。
モデルとコスト
参考: 公式モデル概要(最新の料金・提供状況は公式ページを参照) https://docs.anthropic.com/en/docs/about-claude/models/overview
| モデル | 入力($/100万トークン) | 出力($/100万トークン) | 備考 |
|---|---|---|---|
| Claude Opus 4 | $15 | $75 | 高難度・長時間タスク向け |
| Claude Sonnet 4 | $3 | $15 | 汎用・高速応答、無料プラン一部対応の報告あり |
注: 上記は公開情報に基づく目安です。実際の価格・提供可用性はリージョンやプラン(Free/Pro/Max/Team/Enterprise)、利用チャネル(Anthropic API / Amazon Bedrock / Google Cloud Vertex AI)により異なる場合があります。