AIのAPIに「ラッシュアワー」が生まれた — DeepSeek V4、ピーク時間帯は料金2倍に
電気やタクシーには「ピーク料金」がある。LLMのAPIには、なかった。
DeepSeekがその常識を変えた。7月中旬に予定されているV4の正式リリースに合わせて、API料金にピーク/オフピーク制を導入する。北京時間の9:00〜12:00と14:00〜18:00は全料金が2倍。それ以外の時間帯は通常料金のまま。
LLMの従量課金に「時間帯」という変数が入るのは、おそらく業界初だ。
2倍になっても、まだ安い
ピーク料金の具体的な数字を見てみる。
V4-Flash(軽量モデル):
| オフピーク | ピーク | |
|---|---|---|
| 入力(キャッシュミス) | ¥1.00/百万トークン | ¥2.00 |
| 出力 | ¥2.00/百万トークン | ¥4.00 |
V4-Pro(フラッグシップ):
| オフピーク | ピーク | |
|---|---|---|
| 入力(キャッシュミス) | ¥3.00/百万トークン | ¥6.00 |
| 出力 | ¥6.00/百万トークン | ¥12.00 |
※料金は中国元(CNY)。1CNY ≈ 21円(2026年7月時点)。キャッシュヒット時はさらに大幅に安くなる。
正直、「2倍」と聞くとぎょっとする。だがGPT-5.5と比較すると、ピーク時のV4-Proですら17分の1の価格だ。オフピークならその差はさらに広がる。
DeepSeekの料金戦略は「最安値」から「時間帯で最適化」に進化した。裏を返せば、それだけAPIの利用量が増えているということでもある。
旧モデル廃止 — 7月24日がデッドライン
正式リリースと同時に、レガシーモデル名の廃止も進む。
deepseek-chat→ 現在V4-Flash(非推論モード)にルーティング中deepseek-reasoner→ 現在V4-Flash(推論モード)にルーティング中
7月24日 15:59 UTCをもって、どちらのモデル名でのAPIコールもエラーを返すようになる。7月16日と23日にブラウンアウト(段階的停止)が実施される予定だ。
移行自体は簡単で、model パラメータを deepseek-v4-flash または deepseek-v4-pro に書き換えるだけ。ベースURL、APIキーは変わらない。
ひとつ注意点がある。deepseek-reasoner は名前に反してV4-Flashにルーティングされている。重い推論タスクに使っていた場合、V4-Proに明示的に切り替えないと性能が落ちる可能性がある。
V4の実力をおさらい
4月のプレビュー公開から2ヶ月半。V4の数字を改めて整理しておく。
V4-Pro — 1.6兆パラメータ、トークンあたり49Bアクティブ。SWE-Bench Verified 80.6%、LiveCodeBench 93.5%。100万トークンのコンテキストウィンドウ。V3.2比でFLOPs 27%、KVキャッシュ10%で同等の性能を叩き出す新アーキテクチャ(CSA + HCA)を搭載。
V4-Flash — 284Bパラメータ、13Bアクティブ。SWE-Bench Verified 79.0%(think-maxモード)。Pro比で圧倒的に軽量ながら、コーディング性能はほぼ遜色ない。
どちらもMITライセンスでオープンウェイト公開済み。HuggingFaceでのV4-Proのダウンロード数は先月だけで124万件を超えた。
ピーク料金は他社に広がるか
個人的に気になるのは、この料金モデルが業界標準になるかどうかだ。
OpenAIやAnthropicのAPIにはピーク料金がない。だがGPUコストはどの会社にも等しくかかっている。DeepSeekが「需要に応じた価格変動」で成功すれば、追随する企業は出てくるだろう。
逆に言えば、日本のユーザーにとってはチャンスでもある。北京時間のピーク帯(日本時間10:00〜13:00、15:00〜19:00)を避けてバッチ処理を回せば、世界最安クラスの料金でフロンティアモデルを使える。深夜帯のcronジョブは、思った以上に賢い選択になるかもしれない。
まとめ — 何をすべきか
deepseek-chat/deepseek-reasonerを使っているなら、7月24日までにdeepseek-v4-flashかdeepseek-v4-proに移行するdeepseek-reasonerで重い推論をしていたなら、Flash ではなく Pro を指定する- コスト最適化したいなら、北京時間のオフピーク帯(18:00〜翌9:00、12:00〜14:00)にリクエストを集中させる
OpenAIもAnthropicも、少なくとも現時点ではピーク料金を採用していない。だがDeepSeekが「時間帯で値段が変わる」ことを当たり前にすれば、API利用のコスト設計そのものが変わる。「いつ呼ぶか」がアーキテクチャの一部になる時代に、じわじわと入り始めている。
関連記事
「どのAIが最強?」への日本発の答えは「全部使え」だった — Sakana Fugu
Sakana AIのFuguは複数のフロンティアLLMを自動で使い分けるマルチモデルオーケストレーター。SWE-Bench Pro 73.7%の仕組み、料金、実際の評判を解説。
日次180兆トークン、価格はClaude Opusの10分の1 — ByteDanceのDoubao 2.1 Proが狙う座
ByteDanceがVolcano Engine FORCEで発表したDoubao 2.1 Pro。コーディング・エージェント・マルチモーダルで大幅向上。ベンチマーク、価格、中国AI勢力図での位置を解説。
米企業5万社のAI支出データでDeepSeekが首位 — 「自前で動かす」から「直接課金」への転換
Rampの6月ソフトウェアベンダーランキングでDeepSeekが米国企業の新規課金成長率1位に。オープンソースの自前運用から直接課金へ移行が加速する背景とリスクを分析。