FlowTune Media

OpenAIの次の画像生成AIがLMArenaに「覆面」で出現していた — GPT Image 2リーク情報のすべて

AIモデルの人気ランキングサイトLMArenaに、見慣れないモデル名が3つ、静かに追加されて、そしてすぐに消えた。

maskingtape-alphagaffer-tape-alphapackingtape-alpha。どれも「テープ」の名前がついている。OpenAIが新モデルをArena上で匿名テストする時に使う、典型的な「工具系コードネーム」のパターンだ。早期テスターが触った結果と、リークされたサンプルを突き合わせると、この3つはどうやら同一の新モデルの複数バリアントらしい。通称「GPT Image 2」——OpenAIが次に出すと噂されてきた、フラッグシップの画像生成AIの最有力候補である。

2026年4月現在、OpenAIはGPT Image 2という名前の公式発表を一切していない。モデルページも、APIエイリアスも、ブログ記事もない。にもかかわらず、AI業界の界隈ではすでに「どう見てもこれだ」という空気が広がっている。今日はそのリーク情報を整理して、何が分かっていて何が分かっていないかを線引きしておきたい。

LMArenaでの「覆面出場」の経緯

OpenAIが新モデルをLMArenaに匿名投入するのは今回が初めてではない。GPT-4o画像生成機能の前にも、im-a-good-gpt-2-chatbot のような遊び心のあるコードネームで複数の匿名モデルが現れた経緯がある。Arenaの仕組みは、ユーザーが2つのモデルの出力を見比べて投票するブラインドテストで、モデル名は投票後にしか開示されない。開発元にとっては、ブランド補正のない純粋な性能評価を得られる貴重な場所だ。

今回のテープ三兄弟は、Arena上でユーザー投票の上位に食い込んだ直後に、前触れなく削除された。削除のタイミングは、テスターによる出力サンプルのSNS拡散とほぼ同時だったと複数の早期ユーザーが報告している。「出しすぎて引っ込めた」という、新モデルのリークでよくある動き方だ。

リークで判明した特徴

出力サンプルや触ったテスターの感想を総合すると、GPT Image 2と呼ばれているモデルの特徴は大きく3つに集約される。

1つ目は、テキストレンダリングの精度。画像の中に文字を描く能力のことだ。画像生成AIの長年の弱点で、DALL-E 3やMidjourneyがかなり改善してきたものの、長い英文やロゴ風のレイアウト、日本語フォントではまだ崩れることが多い。リークサンプルのGPT Image 2は、ポスター風のレイアウトに長めの英文コピーをそのまま書けるレベルだとされる。早期テスターの一人は「UIのスクリーンショットをそのまま生成して、実在しないアプリのモックを作れた」と書いている。これが本当なら、デザインの工程がかなり変わる。

2つ目は、同一プロンプトでの一貫性。同じキャラクターを別のシーンで描かせたときに、顔や服装が崩れないか。ここもGPT-4oの画像機能では甘かった部分だが、リークサンプルでは「同じ女性が3枚連続で異なる服装をしている」「同じプロダクトが別角度から撮影されている」という使い方に耐えるレベルに改善しているらしい。

3つ目は、世界知識の統合。物理法則や光源、素材特性への理解度が一段上がっている、という評価が多い。「夕方の森の中、逆光で葉っぱが透ける」みたいなプロンプトで、ちゃんと葉脈が見えて光が拡散する——そういう類の難しい表現が、プロンプトの文字通りに返ってくるという。

GPT-4oの画像機能とは別物らしい

ここが重要なポイントなのだが、GPT Image 2はGPT-4oの画像生成機能の延長ではないようだ。GPT-4oの画像生成は、テキスト生成と同じTransformerの枠組みの中で画像トークンを扱う「統合型」の設計だった。一方、リークサンプルの特性を見る限り、GPT Image 2はゼロから画像生成専用にアーキテクチャを組み直した「専用モデル」らしい、という見方が強い。

これは戦略としても納得がいく。GPT-4oの統合画像生成は、対話の文脈で画像を差し込める便利さはあるものの、純粋な画質ではMidjourney v8やFLUX.2、DeepMindのNano Banana Proに水を開けられていた。OpenAIとしては、ChatGPT内蔵の「お手軽画像生成」と、プロ向けの「ガチ画像生成」を分けて持ちたかったのだろう。プロ向けラインにちゃんと競争力のあるモデルが必要で、それがGPT Image 2、ということらしい。

リリース時期 — 4月下旬〜6月が本命視

LMArenaでのテスト開始がSora(動画生成モデル)の3月のシャットダウンと時期的に近いことから、「Soraの縮退で空いた推論リソースを画像生成に振り向けた」という観測が業界内で出ている。Polymarket的な予測市場では、4月下旬〜6月の発表を78%前後で織り込んでいるとの報道もある。GPT-6が4月14日にグローバルローンチされたばかりなので、そのフォローアップとして、OpenAI DevDayやイベントのタイミングでの発表が一番ありそうに見える。

ただ、ここは明確に「分からない」ゾーンだ。Arenaから引き上げられた後も追加テストが続いている様子で、公式発表までにはまだ調整が入る可能性がある。そもそも「GPT Image 2」という名前自体、OpenAIが正式に使ったものではなく、コミュニティで呼ばれているだけの通称である。正式名称は蓋を開けてみないと分からない。

何ができるようになりそうか

リーク情報が事実に近いとして、このモデルが公開された後に何が変わるか——筆者の見立てを書いておく。

ひとつは、プロダクトのモックアップ作成が「プロンプト一発」になる可能性だ。UIスクリーンショットをそのまま生成できるということは、アプリのランディングページに載せるキャプチャ画像をFigmaで組まなくて良くなる、ということを意味する。スタートアップが「実在しないプロダクトのプロモ映像」を一晩で作る時代はもう来ていたが、その敷居がさらに下がる。

もうひとつは、マーケティングチームのポスター制作フローが崩れる可能性だ。現状のワークフローは「AIでラフを作ってPhotoshopで文字を乗せる」だが、これがもし「テキスト描画の精度が実用レベル」であれば、文字入れの工程そのものが省略できる。デザイナーの仕事は減らないが、作業の配分は間違いなく変わる。

そして、GPT-4oを使って雑にChatGPT上で画像を作っている層が、そのまま自動的にGPT Image 2へアップグレードされる可能性がある。この層は今、品質的には本気のデザインには使えていない。けれどGPT Image 2が後ろ側に入れば、「ChatGPTに頼むだけ」という体験そのものを変えずに、アウトプットのクオリティだけが一段上がる。そしてそれはMidjourneyやFLUXにとって、かなり手強い競合の立ち上がり方だ。

冷静に見るべきところ

とはいえ、リークで舞い上がるのは禁物だ。LMArenaのランキングは「ブラインド投票」の集計であって、画像生成で重視される細かい品質(商用利用できるディテール精度や、特定スタイルの再現性)を必ずしも反映しない。早期テスターの報告にもバイアスが入る。実際に出てくるプロダクト版が、リーク時の品質と同じとは限らない。

料金体系も全く分かっていない。GPT Image 1(GPT-4oのネイティブ画像生成)はAPIでそれなりに高く、一般ユーザーが気軽に叩ける料金ではなかった。GPT Image 2が同じ方向性だと、「Midjourneyの月30ドル使い放題プラン」と比較して割高に見える可能性がある。

そして何より、OpenAIはまだこのモデルの存在すら公式には認めていない。「GPT Image 2」はあくまで通称であり、本当にその名前で出るかも、単独プロダクトとして出るかも、GPT-6のサブ機能として統合されるかも、現時点では誰にも分からない。

それでも、見ておく価値はある

リーク情報ばかりの段階で記事を書くのは、正直、気が引ける部分がある。確定情報が増えてから書いたほうがSEO的にも筋がいい。

でも、画像生成AIの勢力図がまた動き始めている——その事実だけは今の時点で押さえておいて損はない。MidjourneyがV8で芸術性の頂点を取りに行き、FLUX.2がフォトリアリズムを塗り替え、MicrosoftがMAI-Image-2でArenaトップ3に滑り込み、そしてOpenAIが新型を用意している。1モデル出れば勢力図が変わる、そういう時期に入っている。

GPT Image 2が正式発表されたら、この記事は確実にアップデートする予定だ。その時に「テキスト描画はやっぱりすごかった」のか、「ノイズだった」のかは、正直まだ半々くらいの感覚で見ている。Arenaでの覆面テストが強いモデルでよく行われるパターンだという事実と、早期テスターの盛り上がり方を踏まえると、どちらかといえば「本物」の期待値が高いが、画像生成の世界は常に驚きと肩透かしの繰り返しなので油断はできない。

続報を待ちたい。

関連記事