FlowTune Media

AIモデルの「お金の流れ」が初めて可視化された — Anthropicが支出の61%を占める現実

「どのAIモデルが一番使われているのか」。開発者なら一度は気になったことがあるだろう。ベンチマークの数字は溢れているが、実際の本番環境でどのモデルにどれだけのお金が流れているのかを示すデータは、これまでほぼ存在しなかった。

Vercelがその空白を埋めた。同社が運営するAI Gatewayを通過した数兆トークン、数百モデルの匿名集計データを「Production Index」として公開したのだ。7ヶ月分のリアルトラフィック。推測や調査ではなく、実際に動いているプロダクションの数字。

結果は、予想と少しだけ違っていた。

支出の6割がAnthropicに集中している

2026年4月の支出シェアは以下のとおりだ。

プロバイダー 支出シェア トークン量シェア
Anthropic 61% 26%
Google 21% 38%
OpenAI 12% 13%
xAI 10%

一番お金が使われているのはAnthropicで、全体の61%。だがトークン量で見ると、首位はGoogleの38%で、Anthropicは26%にとどまる。

この乖離が意味するのは明快だ。Claudeは高単価な「ここぞ」の場面で使われ、Gemini Flashは安価な大量処理で使われている。同じ開発者が、同じプロダクトの中で、タスクの性質に応じてモデルを使い分けている。

正直、Anthropicが支出の6割というのは想像以上だった。コーディングエージェントやエンタープライズ向け推論で、Claude OpusとSonnetが圧倒的な信頼を勝ち取っているということだろう。

エージェント時代の数字が出始めている

もうひとつ注目すべきデータがある。ツールコールの比率だ。

2025年10月にはAI Gateway経由のリクエストのうち、ツールコールで終わるものは11.4%だった。それが2026年4月には22.2%に倍増。さらに、全トークンの58.9%がツールコールを含むリクエストで消費されている(半年前は31.6%)。

これは何を意味するか。AIが「テキストを返す」だけでなく「行動する」フェーズに入っていることの、数字による裏付けだ。検索する、ファイルを書く、APIを叩く。エージェント的な使い方がもはやニッチではなく、本番トラフィックの過半数を占めている。

OpenAIの巻き返しとxAIの立ち位置

4月のデータで見逃せないのは、OpenAIのシェアが急伸していること。GPT-5.4やGPT-5.5のリリースを受け、支出シェアが3倍に跳ね上がった。とはいえ12%なので、Anthropicの61%とはまだ大きな差がある。

xAIのGrokは興味深いポジションにいる。ビルディング(開発)用途のトークン量で20%、アウトリーチ用途でも18%のシェアを持ちながら、支出シェアはそれより小さい。つまり「安いのにそこそこ使える」枠を確立している。価格勝負でニッチを取るxAIの戦略が、数字に表れている。

このデータをどう使うか

開発者にとってこのレポートの価値は、モデル選定の客観的な参考材料になる点だ。

「他の開発者が本番で実際に何を選んでいるか」は、ベンチマークスコアよりもリアルな判断材料になる。たとえばコーディングエージェントを構築するなら、支出シェアが示すとおりClaudeが実績で選ばれている。一方、チャットボットのような大量リクエストを捌く用途なら、トークン量シェアが示すとおりGemini Flashのコストパフォーマンスが実戦で証明されている。

ただし注意点もある。このデータはVercel AI Gatewayを経由するトラフィックに限定されている。Vercelのユーザー層はフロントエンド・フルスタック開発者が中心で、エンタープライズの内部システムやモバイルアプリのトラフィックは含まれていない可能性が高い。AIモデル市場全体の縮図とは限らない。

市場が「一強」ではなく「使い分け」に向かっている

このレポートが示す最大のメッセージは、AI市場が「どのモデルが勝つか」の一騎打ちではなく、「どのタスクにどのモデルを当てるか」の最適化競争に移行しているということだ。

Anthropicは高単価・高信頼の推論で稼ぎ、Googleは低単価・大量処理でトークン量を制し、OpenAIは汎用性で巻き返しを図り、xAIは価格で隙間を突く。勝者は一人ではなく、レイヤーごとに違う。

開発者にとっては、「一つのモデルに賭ける」時代が終わりつつあるということでもある。マルチモデル運用の時代に、こうした実データが公開されることの意義は大きい。

関連記事