GPT-5.5の3週間後にもう次が見えた — GPT-5.6「iris-alpha」リークから読み取れること

GPT-5.5が全ユーザーに行き渡る前に、次のモデルの気配がもう漂っている。

5月下旬、複数の開発者がOpenAI Codexのロールアウトログの中にgpt-5.6という見慣れない文字列を発見した。内部コードネームは「iris-alpha」。GPT-5.5のリリースからわずか3週間後の出来事だ。

OpenAIは何も発表していない。公式ベンチマークもAPIエンドポイントも存在しない。だが流出した情報を繋ぎ合わせると、それなりに具体的な輪郭が見えてくる。

判明していること

リーク情報は主に3つのソースから出ている。Codexのバックエンドログ、ChatGPT Pro経由でモデルを呼び出したとする開発者の報告、そしてPolymarketの予測市場だ。

1.5Mトークンのコンテキストウィンドウ。 現行GPT-5.5の約104万トークンから43%増。Claude Opus 4.8が100万トークン、Gemini 3.5 Flashも100万トークンなので、実現すればコンテキスト長で業界トップに立つことになる。もっとも、コンテキストが長ければいいという単純な話ではなく、長文の中間部分を見落とす「Lost in the Middle」問題がどこまで解消されているかが問われる。

フロントエンドUI生成の大幅改善。 リーク元のスクリーンショットによると、ミニマルなノートアプリのレイアウトなど、最小限のプロンプトからプロダクション品質に近いUIを出力できるようになっているという。v0やLovableのような「バイブコーディング」ツールとの連携で、生成されたUIの手直し工程が減る可能性がある。

3つの内部テストコードネーム。 iris-alpha以外に、ember-alphaとbeacon-alphaの存在が確認されている。異なるレイテンシ・品質のバランスを持つ複数バリエーションを同時にテストしていると推測される。GPT-5.5でもInstant版とフル版を分けていたことを考えると、自然な流れだ。

まだ確認できていないこと

念のため強調しておくと、上記はすべて非公式情報だ。

正式なベンチマーク結果は一切公開されていない。SWE-benchやHumanEval、Terminal-Benchといった業界標準のスコアは不明だ。GPT-5.5がTerminal-Bench 2.0で82.7%を記録しているが、5.6でこれがどう動くかは推測の域を出ない。

価格設定も不明。GPT-5.5は$2.50/$10（入力/出力、100万トークンあたり）だが、コンテキスト長が43%伸びればキャッシュ戦略次第でコスト構造は変わり得る。

リリース時期についてはPolymarketで6月中の確率が85%を超えているものの、OpenAIの過去のリリースパターンを見ると延期も珍しくない。

なぜ3週間でもう次のモデルなのか

この速度感は異常に見えるかもしれないが、2026年のAIモデル市場を考えると合理的だ。

5月だけでも、AnthropicがOpus 4.8を投入し（5/28）、GoogleがGemini 3.5 Flashを出し（5/19）、CursorがComposer 2.5で独自モデルを載せた（5/18）。OpenAIが手を休めていれば、あっという間に追いつかれる。

特に気になるのはコンテキスト長の競争だ。Claude Opus 4.8は100万トークン、Gemini 3.5 Flashも100万トークン。GPT-5.5の104万トークンでは差別化にならない。1.5Mトークンは「他社に明確に勝てる数字」を出しに来ている印象がある。

もう一つの文脈はMicrosoft Build 2026だ。MicrosoftがProject Polarisという自社コーディングモデルを発表する直前というタイミングで、OpenAI側も「まだGPTのほうが先を行っている」と示す意味がある。パートナーでありながら競合でもある両社の関係が、モデル開発の速度をさらに押し上げている。

正式発表を待つ間にできること

今の段階でユーザーがやるべきことは特にないが、コンテキスト長が1.5Mに拡大した場合のインパクトは考えておく価値がある。

たとえば、大規模なコードベース全体をコンテキストに投入するワークフローが現実味を帯びる。現在のClaude Codeが100万トークンで10万行程度のコードを扱えるとすると、1.5Mなら約15万行。中規模のプロダクションコードベースをまるごと読み込ませたうえで修正を指示する、という使い方が視野に入ってくる。

あるいは、長大な法律文書や医療論文の横断分析。GPT-5.5 Instantが「法律・医療・金融でのハルシネーションを削減した」とOpenAIが謳っていた路線の延長で、より多くの資料を一度に処理できるようになれば、専門職向けの実用性が一段上がる。

いずれにせよ、正式発表があるまではあくまで「リーク段階の情報」として扱うべきだ。確定情報が出次第、この記事を更新する。

GPT-5.5の3週間後にもう次が見えた — GPT-5.6「iris-alpha」リークから読み取れること

判明していること

まだ確認できていないこと

なぜ3週間でもう次のモデルなのか

正式発表を待つ間にできること

関連記事

GPT-5.6が出た。ただし使えるのは、米政府が選んだ20社だけ

ChatGPTが「嘘をつきにくく」なった — GPT-5.5 Instantへの静かな切り替えで何が変わるか

"Spud" と呼ばれているモデルが4月末に来るかもしれない — OpenAIの次期フラッグシップをめぐる既知と未知