FlowTune Media

DeepSeek V4が75%値下げを恒久化 — 100万トークン0.87ドルの衝撃

4月24日にDeepSeek V4 Proがローンチしたとき、APIの価格表には「5月31日まで75%オフ」と書かれていた。期間限定のプロモーション価格だ。

その割引が、5月25日付けで恒久化された

DeepSeekの公式発表によれば、V4 Proの新しい正規料金は以下の通り。

項目 旧正規価格 新正規価格(75%オフ恒久化)
キャッシュヒット入力 $0.0145 / 1M tokens $0.003625 / 1M tokens
キャッシュミス入力 $1.74 / 1M tokens $0.435 / 1M tokens
出力 $3.48 / 1M tokens $0.87 / 1M tokens

出力100万トークンあたり0.87ドル。日本円に換算すると約130円。Claude Opus 4.8の出力が$25、GPT-5.5が同価格帯であることを考えると、文字通り桁が違う。

なぜ「プロモ」を「正規」にできたのか

値下げの背景には、V4 Proのアーキテクチャ改善がある。

V4 Proは1.6兆パラメータの巨大なMixture-of-Experts(MoE)モデルだが、推論時にアクティブになるのは490億パラメータだけ。さらに、100万トークンのコンテキストを処理する際のコンピュート消費量が前モデルV3.2比で27%、メモリ使用量は**10%**にまで圧縮されている。

この効率化を実現しているのが、Compressed Sparse Attention(CSA)とHeavily Compressed Attention(HCA)を組み合わせたハイブリッドアテンション機構だ。要するに、長文処理にかかるコストを技術的に激減させたから、その分をそのまま価格に反映できた——という理屈になる。

プロモーション価格が「期間限定のお得感」ではなく「実際の原価構造に近い水準」だったということだ。

開発者にとっての実際のインパクト

APIを叩いてプロダクトを作っている開発者にとって、この価格は計算が変わるレベルの話だ。

たとえば、AIコーディングエージェントを自社で構築している場合を考える。1回のタスク実行で平均5万トークンを出力するとして、V4 Proなら1回あたり約0.04ドル(約6円)。同じタスクをClaude Opus 4.8で回すと約1.25ドル(約190円)。1日100回実行すれば、月額の差は約5,500ドル(約83万円)になる。

もちろん、モデルの性能が同じわけではない。SWE-bench VerifiedではClaude Opus 4.8が88.6%に対し、V4 Proは公表値で同等クラスとされるが、実際のタスク精度は用途によって大きく変わる。安いからといって、すべてのユースケースでDeepSeekに置き換えられるわけではない。

ただし、「精度80%で十分」なタスク——ドキュメント要約、コード補完の下書き、データ抽出など——をDeepSeekに回して、精度が求められる部分だけClaudeやGPTを使う、というルーティングは現実的な選択肢になった。OpenRouterのようなAPIルーティングサービスが伸びている理由はここにある。

価格戦争の「新しい常識」

DeepSeekの動きは、AI業界の価格構造に対する強いメッセージだ。

Claude Opus 4.8やGPT-5.5が性能で勝っていても、30倍の価格差がある状況で「常にフロンティアモデルを使う」という選択は、ほとんどの開発者にとって合理的ではなくなる。結果として、モデルの選択は「どれが一番賢いか」ではなく「このタスクに必要な精度レベルに対して、最もコスパがいいのはどれか」という判断に変わっていく。

正直なところ、DeepSeekの中国企業としてのリスク——データ主権の問題、突然のサービス変更、地政学的リスク——を気にする開発者は少なくない。特にエンタープライズ用途では、これらの懸念がコスト優位性を打ち消す場面もあるだろう。

だが個人開発者やスタートアップにとって、出力100万トークン0.87ドルという数字は無視できない。従来「APIコストが高くて実装を見送っていた」機能が、DeepSeekの価格なら実験的に試せる範囲に入る。AIエージェントを何十体も並列で走らせるワークフローも、コスト面のハードルが大幅に下がった。

この値下げが「プロモーションの期間限定」ではなく「正規価格」になったことの意味は大きい。他のプロバイダーがこの価格に追随するか、それとも性能差で棲み分けるか。2026年後半のAI市場を見る上で、ひとつの分水嶺になりそうだ。

関連記事