AIのAPIに「ラッシュアワー」が生まれた — DeepSeek V4、ピーク時間帯は料金2倍に

電気やタクシーには「ピーク料金」がある。LLMのAPIには、なかった。

DeepSeekがその常識を変えた。7月中旬に予定されているV4の正式リリースに合わせて、API料金にピーク/オフピーク制を導入する。北京時間の9:00〜12:00と14:00〜18:00は全料金が2倍。それ以外の時間帯は通常料金のまま。

LLMの従量課金に「時間帯」という変数が入るのは、おそらく業界初だ。

2倍になっても、まだ安い

ピーク料金の具体的な数字を見てみる。

V4-Flash（軽量モデル）:

	オフピーク	ピーク
入力（キャッシュミス）	¥1.00/百万トークン	¥2.00
出力	¥2.00/百万トークン	¥4.00

V4-Pro（フラッグシップ）:

	オフピーク	ピーク
入力（キャッシュミス）	¥3.00/百万トークン	¥6.00
出力	¥6.00/百万トークン	¥12.00

※料金は中国元（CNY）。1CNY ≈ 21円（2026年7月時点）。キャッシュヒット時はさらに大幅に安くなる。

正直、「2倍」と聞くとぎょっとする。だがGPT-5.5と比較すると、ピーク時のV4-Proですら17分の1の価格だ。オフピークならその差はさらに広がる。

DeepSeekの料金戦略は「最安値」から「時間帯で最適化」に進化した。裏を返せば、それだけAPIの利用量が増えているということでもある。

旧モデル廃止 — 7月24日がデッドライン

正式リリースと同時に、レガシーモデル名の廃止も進む。

deepseek-chat → 現在V4-Flash（非推論モード）にルーティング中
deepseek-reasoner → 現在V4-Flash（推論モード）にルーティング中

7月24日 15:59 UTCをもって、どちらのモデル名でのAPIコールもエラーを返すようになる。7月16日と23日にブラウンアウト（段階的停止）が実施される予定だ。

移行自体は簡単で、model パラメータを deepseek-v4-flash または deepseek-v4-pro に書き換えるだけ。ベースURL、APIキーは変わらない。

ひとつ注意点がある。deepseek-reasoner は名前に反してV4-Flashにルーティングされている。重い推論タスクに使っていた場合、V4-Proに明示的に切り替えないと性能が落ちる可能性がある。

V4の実力をおさらい

4月のプレビュー公開から2ヶ月半。V4の数字を改めて整理しておく。

V4-Pro — 1.6兆パラメータ、トークンあたり49Bアクティブ。SWE-Bench Verified 80.6%、LiveCodeBench 93.5%。100万トークンのコンテキストウィンドウ。V3.2比でFLOPs 27%、KVキャッシュ10%で同等の性能を叩き出す新アーキテクチャ（CSA + HCA）を搭載。

V4-Flash — 284Bパラメータ、13Bアクティブ。SWE-Bench Verified 79.0%（think-maxモード）。Pro比で圧倒的に軽量ながら、コーディング性能はほぼ遜色ない。

どちらもMITライセンスでオープンウェイト公開済み。HuggingFaceでのV4-Proのダウンロード数は先月だけで124万件を超えた。

ピーク料金は他社に広がるか

個人的に気になるのは、この料金モデルが業界標準になるかどうかだ。

OpenAIやAnthropicのAPIにはピーク料金がない。だがGPUコストはどの会社にも等しくかかっている。DeepSeekが「需要に応じた価格変動」で成功すれば、追随する企業は出てくるだろう。

逆に言えば、日本のユーザーにとってはチャンスでもある。北京時間のピーク帯（日本時間10:00〜13:00、15:00〜19:00）を避けてバッチ処理を回せば、世界最安クラスの料金でフロンティアモデルを使える。深夜帯のcronジョブは、思った以上に賢い選択になるかもしれない。

まとめ — 何をすべきか

deepseek-chat / deepseek-reasoner を使っているなら、7月24日までに deepseek-v4-flash か deepseek-v4-pro に移行する
deepseek-reasoner で重い推論をしていたなら、Flash ではなく Pro を指定する
コスト最適化したいなら、北京時間のオフピーク帯（18:00〜翌9:00、12:00〜14:00）にリクエストを集中させる

OpenAIもAnthropicも、少なくとも現時点ではピーク料金を採用していない。だがDeepSeekが「時間帯で値段が変わる」ことを当たり前にすれば、API利用のコスト設計そのものが変わる。「いつ呼ぶか」がアーキテクチャの一部になる時代に、じわじわと入り始めている。

DeepSeek公式サイト / APIドキュメント

AIのAPIに「ラッシュアワー」が生まれた — DeepSeek V4、ピーク時間帯は料金2倍に

2倍になっても、まだ安い

旧モデル廃止 — 7月24日がデッドライン

V4の実力をおさらい

ピーク料金は他社に広がるか

まとめ — 何をすべきか

関連記事

「どのAIが最強？」への日本発の答えは「全部使え」だった — Sakana Fugu

日次180兆トークン、価格はClaude Opusの10分の1 — ByteDanceのDoubao 2.1 Proが狙う座

米企業5万社のAI支出データでDeepSeekが首位 — 「自前で動かす」から「直接課金」への転換