FlowTune Media

GPT-5.6が出た。ただし使えるのは、米政府が選んだ20社だけ

6月26日、OpenAIがGPT-5.6を発表した。

ここまでは通常の速報だ。だがリリースの形が異常だった。一般公開ではなく、米政府が個別に承認した約20の組織だけに限定プレビューとして提供されたのだ。フロンティアAIモデルが政府のアクセスリスト付きでローンチされるのは、アメリカのAI企業として初めてのこと。

トランプ政権が6月2日に署名したAI大統領令に基づく措置で、OpenAIは「この制限が常態化すべきではない」と釘を刺しつつも、要請に従った。TechCrunchの報道によると、数週間以内に一般公開される見通しだが、具体的な日程は示されていない。

Sol、Terra、Luna — 3つのGPT-5.6

今回のリリースで最も目を引くのは、GPT-5.6が単一モデルではなく3層構成になったことだ。

Solはフラッグシップ。OpenAI史上最強モデルという位置づけで、コーディング、生物学、サイバーセキュリティのエージェント性能を重点的に強化している。Terminal-Bench 2.1ではultraモードで91.91%を記録。GPT-5.5の83.4%から8ポイント以上の改善で、Claude Mythos 5の88%も超えた。

Terraは実務向けのバランス型。性能はGPT-5.5とほぼ同等で、Solの半額。「フラッグシップは要らないが、5.6世代の改善は欲しい」というユーザー向けだ。

Lunaは速度とコスト最優先。OpenAIのラインナップで最も安い。レイテンシが重要なリアルタイム処理や、大量のAPIコールを捌くバッチ処理に向く。

名前は太陽系から取っている。Sol(太陽)が最も明るく、Terra(地球)が日常を支え、Luna(月)が軽やかに動く。OpenAIらしい命名だ。

ベンチマーク — 「初めて50%を超えた」の意味

数字を並べておく。

ベンチマーク Sol (ultra) Sol (max) GPT-5.5 Claude Mythos 5
Terminal-Bench 2.1 91.91% 88.76% 83.4% 88.0%
Agent's Last Exam 50.9%

Terminal-Benchの91.91%も立派だが、注目すべきはAgent's Last Examの50.9%だ。これは複数ステップにわたる実世界タスクの完了率を測るベンチマークで、Solが初めて半数のタスクを完遂したモデルになった。

コーディングタスクをただ解くだけでなく、ファイルを探し、依存関係を調べ、テストを書いて実行し、エラーを修正する——そういう一連の工程を半分以上こなせるようになった、ということだ。

ultraモード — 1つのAIが部下を持つ

Solには新しい推論モードが追加された。従来の「low / medium / high」に加えて「max」と「ultra」が使える。

maxは単純に推論時間を延ばして精度を上げるモード。注目はultraだ。ultraではSolがサブエージェントを起動して並列処理する。つまり、1つのAIが複数のAIに仕事を振り分けるマネージャーのように振る舞う。

従来のモデルは1本のスレッドで逐次処理していた。ultraモードでは、たとえば「このリポジトリのセキュリティ脆弱性を洗い出して」と頼むと、Solがコードの異なる領域を複数のサブエージェントに割り振り、結果を統合して返す——という動きが可能になる。

正直、これはClaude Codeのサブエージェント機能やGeminiのDeep Thinkingに近い発想だ。OpenAIも「サブエージェントによるタスク分割」がフロンティア性能のカギだと認めた格好になる。

料金 — Terraが「本命」の理由

モデル 入力 ($/1M tokens) 出力 ($/1M tokens) 日本円換算(出力)
Sol $5.00 $30.00 約4,500円
Terra $2.50 $15.00 約2,250円
Luna $1.00 $6.00 約900円
GPT-5.5 $2.50 $10.00 約1,500円

Solは高い。出力$30/Mトークンは、Claude Opus 4.8の$15/Mの2倍、GPT-5.5の3倍だ。ultraモードの計算コストを考えると仕方ないが、個人開発者が気軽に使える価格ではない。

面白いのはTerraの立ち位置だ。入力価格はGPT-5.5と同じ$2.50だが、出力が$15と5割増し。それでもGPT-5.5同等の性能を持ちながら「5.6世代」のキャッシュ改善やツール対応が入っている。GPT-5.5からの移行先としては最も自然な選択肢になるだろう。

Lunaは$1/$6で、Gemini 3.5 Flashの$1.50/$9とほぼ同じ価格帯。速度勝負のユースケースでFlashと直接ぶつかる。

もう一つ地味だが重要な変更がある。プロンプトキャッシュの最低保持時間が30分に延長された。従来の5分から6倍。キャッシュ書き込みコストは通常の1.25倍だが、頻繁に同じプロンプトを使うアプリケーションではトータルコストが下がる。

政府管理下のAIリリース — 何が変わったのか

今回の配布制限は、技術的な問題ではなく政治的な判断だ。

6月2日のAI大統領令で「フロンティアAIモデルのリリースには政府との事前協議が必要」という枠組みが作られた。GPT-5.6はその枠組みの下で公開された最初のモデルになった。CNNによると、ホワイトハウスがOpenAIにリリースの制限を要請し、OpenAIがそれに応じた。

約20社のプレビューパートナーは、政府に名前を個別に報告し、承認を受けている。OpenAIは「信頼できるパートナー」と表現しているが、実態は政府が配布先を決めている。

この仕組みが今後のAIリリースの標準になるかは未知数だ。AnthropicのFable 5も輸出規制の対象になっているし、中国のDeepSeekやQwenは別の規制圧力に直面している。「強すぎるAIモデルは自由に配布できない」という流れは、業界全体に広がりつつある。

一般ユーザーはいつ使えるのか

OpenAIは「数週間以内に一般公開」と言っている。

ChatGPT PlusやProのユーザーにまずSolが開放され、その後APIが一般利用可能になる——というのがGPT-5.5のときのパターンだった。5.6でも同様の流れが予想される。

ただし、ultraモードがすべてのプランで使えるかは不明だ。サブエージェントの計算コストを考えると、ChatGPT ProやAPIの上位プランに限定される可能性が高い。

待っている間にできることは少ないが、一つだけ。GPT-5.5で組んでいるワークフローがあるなら、Terraへの移行準備をしておくといい。入力価格は同じで、出力がやや高くなるが、キャッシュ改善やツール対応の進化で帳尻が合うケースは多いはずだ。

3層構成が示す「モデル選びの終わり」

GPT-5.6の3層構成を見て思うのは、「どのモデルを使うか」という選択自体がそろそろ消えるかもしれない、ということだ。

SolとTerraとLunaは同じGPT-5.6ファミリーの中で、タスクの重さに応じて自動的に切り替わるべき存在だ。簡単な質問にはLuna、日常的な作業にはTerra、本当に難しい問題にだけSolが出てくる——そういうルーティングが裏側で行われれば、ユーザーは「モデル名」を意識する必要がなくなる。

実際、Sakana AIのFuguやOpenRouterのようなモデルルーティングサービスが急成長しているのは、ユーザーがモデル選びに疲れている証拠だ。OpenAI自身が3層を出したことで、「公式ルーター」が登場する土壌はできた。

一般公開の日程が出たら、この記事を更新する。

関連記事