GPT-5.5の3週間後にもう次が見えた — GPT-5.6「iris-alpha」リークから読み取れること
GPT-5.5が全ユーザーに行き渡る前に、次のモデルの気配がもう漂っている。
5月下旬、複数の開発者がOpenAI Codexのロールアウトログの中にgpt-5.6という見慣れない文字列を発見した。内部コードネームは「iris-alpha」。GPT-5.5のリリースからわずか3週間後の出来事だ。
OpenAIは何も発表していない。公式ベンチマークもAPIエンドポイントも存在しない。だが流出した情報を繋ぎ合わせると、それなりに具体的な輪郭が見えてくる。
判明していること
リーク情報は主に3つのソースから出ている。Codexのバックエンドログ、ChatGPT Pro経由でモデルを呼び出したとする開発者の報告、そしてPolymarketの予測市場だ。
1.5Mトークンのコンテキストウィンドウ。 現行GPT-5.5の約104万トークンから43%増。Claude Opus 4.8が100万トークン、Gemini 3.5 Flashも100万トークンなので、実現すればコンテキスト長で業界トップに立つことになる。もっとも、コンテキストが長ければいいという単純な話ではなく、長文の中間部分を見落とす「Lost in the Middle」問題がどこまで解消されているかが問われる。
フロントエンドUI生成の大幅改善。 リーク元のスクリーンショットによると、ミニマルなノートアプリのレイアウトなど、最小限のプロンプトからプロダクション品質に近いUIを出力できるようになっているという。v0やLovableのような「バイブコーディング」ツールとの連携で、生成されたUIの手直し工程が減る可能性がある。
3つの内部テストコードネーム。 iris-alpha以外に、ember-alphaとbeacon-alphaの存在が確認されている。異なるレイテンシ・品質のバランスを持つ複数バリエーションを同時にテストしていると推測される。GPT-5.5でもInstant版とフル版を分けていたことを考えると、自然な流れだ。
まだ確認できていないこと
念のため強調しておくと、上記はすべて非公式情報だ。
正式なベンチマーク結果は一切公開されていない。SWE-benchやHumanEval、Terminal-Benchといった業界標準のスコアは不明だ。GPT-5.5がTerminal-Bench 2.0で82.7%を記録しているが、5.6でこれがどう動くかは推測の域を出ない。
価格設定も不明。GPT-5.5は$2.50/$10(入力/出力、100万トークンあたり)だが、コンテキスト長が43%伸びればキャッシュ戦略次第でコスト構造は変わり得る。
リリース時期についてはPolymarketで6月中の確率が85%を超えているものの、OpenAIの過去のリリースパターンを見ると延期も珍しくない。
なぜ3週間でもう次のモデルなのか
この速度感は異常に見えるかもしれないが、2026年のAIモデル市場を考えると合理的だ。
5月だけでも、AnthropicがOpus 4.8を投入し(5/28)、GoogleがGemini 3.5 Flashを出し(5/19)、CursorがComposer 2.5で独自モデルを載せた(5/18)。OpenAIが手を休めていれば、あっという間に追いつかれる。
特に気になるのはコンテキスト長の競争だ。Claude Opus 4.8は100万トークン、Gemini 3.5 Flashも100万トークン。GPT-5.5の104万トークンでは差別化にならない。1.5Mトークンは「他社に明確に勝てる数字」を出しに来ている印象がある。
もう一つの文脈はMicrosoft Build 2026だ。MicrosoftがProject Polarisという自社コーディングモデルを発表する直前というタイミングで、OpenAI側も「まだGPTのほうが先を行っている」と示す意味がある。パートナーでありながら競合でもある両社の関係が、モデル開発の速度をさらに押し上げている。
正式発表を待つ間にできること
今の段階でユーザーがやるべきことは特にないが、コンテキスト長が1.5Mに拡大した場合のインパクトは考えておく価値がある。
たとえば、大規模なコードベース全体をコンテキストに投入するワークフローが現実味を帯びる。現在のClaude Codeが100万トークンで10万行程度のコードを扱えるとすると、1.5Mなら約15万行。中規模のプロダクションコードベースをまるごと読み込ませたうえで修正を指示する、という使い方が視野に入ってくる。
あるいは、長大な法律文書や医療論文の横断分析。GPT-5.5 Instantが「法律・医療・金融でのハルシネーションを削減した」とOpenAIが謳っていた路線の延長で、より多くの資料を一度に処理できるようになれば、専門職向けの実用性が一段上がる。
いずれにせよ、正式発表があるまではあくまで「リーク段階の情報」として扱うべきだ。確定情報が出次第、この記事を更新する。
関連記事
ChatGPTが「嘘をつきにくく」なった — GPT-5.5 Instantへの静かな切り替えで何が変わるか
ChatGPTデフォルトがGPT-5.5 Instantに。嘘半減・応答3割短縮・メモリソースの変更点を整理。
"Spud" と呼ばれているモデルが4月末に来るかもしれない — OpenAIの次期フラッグシップをめぐる既知と未知
OpenAIの次期モデル(コードネームSpud)は2026年3月24日にプリトレーニング完了。GPT-5.5とGPT-6のどちらで出るのか、リリース予測、Brockman発言の読み解き方まで、現時点で確実な情報と推測を分けて整理する。
ChatGPTの裏で動いている「控えのAI」が、静かに賢くなっていた — GPT-5.3 Instant Mini
OpenAIがChatGPTのフォールバックモデルGPT-5.3 Instant Miniを公開。モデルピッカーに出てこない「無料・Plus枠の控え選手」が何を改善したか、無料ユーザーに効く理由を整理する。