FlowTune Media

AIのAPIに「ラッシュアワー」が生まれた — DeepSeek V4、ピーク時間帯は料金2倍に

電気やタクシーには「ピーク料金」がある。LLMのAPIには、なかった。

DeepSeekがその常識を変えた。7月中旬に予定されているV4の正式リリースに合わせて、API料金にピーク/オフピーク制を導入する。北京時間の9:00〜12:00と14:00〜18:00は全料金が2倍。それ以外の時間帯は通常料金のまま。

LLMの従量課金に「時間帯」という変数が入るのは、おそらく業界初だ。

2倍になっても、まだ安い

ピーク料金の具体的な数字を見てみる。

V4-Flash(軽量モデル):

オフピーク ピーク
入力(キャッシュミス) ¥1.00/百万トークン ¥2.00
出力 ¥2.00/百万トークン ¥4.00

V4-Pro(フラッグシップ):

オフピーク ピーク
入力(キャッシュミス) ¥3.00/百万トークン ¥6.00
出力 ¥6.00/百万トークン ¥12.00

※料金は中国元(CNY)。1CNY ≈ 21円(2026年7月時点)。キャッシュヒット時はさらに大幅に安くなる。

正直、「2倍」と聞くとぎょっとする。だがGPT-5.5と比較すると、ピーク時のV4-Proですら17分の1の価格だ。オフピークならその差はさらに広がる。

DeepSeekの料金戦略は「最安値」から「時間帯で最適化」に進化した。裏を返せば、それだけAPIの利用量が増えているということでもある。

旧モデル廃止 — 7月24日がデッドライン

正式リリースと同時に、レガシーモデル名の廃止も進む。

  • deepseek-chat → 現在V4-Flash(非推論モード)にルーティング中
  • deepseek-reasoner → 現在V4-Flash(推論モード)にルーティング中

7月24日 15:59 UTCをもって、どちらのモデル名でのAPIコールもエラーを返すようになる。7月16日と23日にブラウンアウト(段階的停止)が実施される予定だ。

移行自体は簡単で、model パラメータを deepseek-v4-flash または deepseek-v4-pro に書き換えるだけ。ベースURL、APIキーは変わらない。

ひとつ注意点がある。deepseek-reasoner は名前に反してV4-Flashにルーティングされている。重い推論タスクに使っていた場合、V4-Proに明示的に切り替えないと性能が落ちる可能性がある。

V4の実力をおさらい

4月のプレビュー公開から2ヶ月半。V4の数字を改めて整理しておく。

V4-Pro — 1.6兆パラメータ、トークンあたり49Bアクティブ。SWE-Bench Verified 80.6%、LiveCodeBench 93.5%。100万トークンのコンテキストウィンドウ。V3.2比でFLOPs 27%、KVキャッシュ10%で同等の性能を叩き出す新アーキテクチャ(CSA + HCA)を搭載。

V4-Flash — 284Bパラメータ、13Bアクティブ。SWE-Bench Verified 79.0%(think-maxモード)。Pro比で圧倒的に軽量ながら、コーディング性能はほぼ遜色ない。

どちらもMITライセンスでオープンウェイト公開済み。HuggingFaceでのV4-Proのダウンロード数は先月だけで124万件を超えた。

ピーク料金は他社に広がるか

個人的に気になるのは、この料金モデルが業界標準になるかどうかだ。

OpenAIやAnthropicのAPIにはピーク料金がない。だがGPUコストはどの会社にも等しくかかっている。DeepSeekが「需要に応じた価格変動」で成功すれば、追随する企業は出てくるだろう。

逆に言えば、日本のユーザーにとってはチャンスでもある。北京時間のピーク帯(日本時間10:00〜13:00、15:00〜19:00)を避けてバッチ処理を回せば、世界最安クラスの料金でフロンティアモデルを使える。深夜帯のcronジョブは、思った以上に賢い選択になるかもしれない。

まとめ — 何をすべきか

  1. deepseek-chat / deepseek-reasoner を使っているなら、7月24日までdeepseek-v4-flashdeepseek-v4-pro に移行する
  2. deepseek-reasoner で重い推論をしていたなら、Flash ではなく Pro を指定する
  3. コスト最適化したいなら、北京時間のオフピーク帯(18:00〜翌9:00、12:00〜14:00)にリクエストを集中させる

OpenAIもAnthropicも、少なくとも現時点ではピーク料金を採用していない。だがDeepSeekが「時間帯で値段が変わる」ことを当たり前にすれば、API利用のコスト設計そのものが変わる。「いつ呼ぶか」がアーキテクチャの一部になる時代に、じわじわと入り始めている。

DeepSeek公式サイト / APIドキュメント

関連記事