Sundar Pichaiが「来月には」と言ったあのモデル — Gemini 3.5 Proが6月に来る

5月19日のGoogle I/O 2026基調講演。Sundar Pichai氏が「Gemini 3.5を発表します」と切り出した瞬間、会場の期待は明らかにProモデルに向いていた。
ところが、当日リリースされたのはFlashだけ。Proについては「来月にお届けします」というアナウンスで、客席からは小さなため息が漏れた、と複数のメディアが報じている。
その「来月」が、いよいよ6月。Gemini 3.5 ProのGAは秒読み段階に入った。
何を待っているのか — Flashで分かったProの宿題
Gemini 3.5 Proを「期待されているフラッグシップ」と一言で片付けるのは簡単だが、なぜそれが必要かを Flash の数字を見て整理しておきたい。
Google公式ブログとWaveSpeed Blogの分析を突き合わせると、Gemini 3.5 Flashは速度・コーディング・エージェント系のベンチマークでは3.1 Proを上回っている。エージェント的なターミナルコーディングで76.2%、エージェント的なコンピュータユースで78.4%。これは確かにフロンティアレベルだ。
だが、いくつかの領域でFlashは3.1 Proに「明確に劣後」している。
| ベンチマーク | 3.5 Flash | 3.1 Pro | 差分 |
|---|---|---|---|
| Humanity's Last Exam | 40.2% | 44.4% | -4.2pt |
| ARC-AGI-2 | 72.1% | 77.1% | -5.0pt |
| Long-context(128K) | 77.3% | 84.9% | -7.6pt |
ハードな推論、抽象的なパターン認識、そして長コンテキストでの情報追跡 — このあたりがFlashの弱点として残された。
つまりGemini 3.5 Proは、Flashが意図的に切り捨てた「重い思考」をPro側で取り戻す役割を背負っている。Flashで速さとコストを取り、Proで知性のフロンティアを担う。Gemini 3シリーズが「1モデルですべて」だった構図から、明確に役割分担型に振った形だ。
注目したいのは「Deep Think」の有無
個人的に一番興味があるのは、Pro に Deep Think モードが標準搭載されるかどうかだ。
Deep Think は本来 Gemini 3 シリーズで導入された「複数経路の並行推論」モード。難問に対してモデルが複数の解法を同時に検討し、ベストなものを選び取る仕組みで、国際数学オリンピック級の問題で実績を出してきた(既存記事「Gemini 3 Deep ThinkがOlympiadで金メダル」参照)。
このモードは現状、AI Ultraサブスクライバー限定で、しかも別途モデルとして提供されている。3.5 Pro が標準でDeep Think相当の機能を内包するなら、AnthropicのExtended Thinking、OpenAIのo1系統に対するGoogleの正式回答になる。
逆に、Deep Think が別モデルのまま据え置かれた場合、Pro は単に「Flashの上位版」止まりで、フロンティア推論のリーダーシップは Opus 4.8 や GPT-5.5 寄りに留まる可能性がある。
コンテキスト長は1Mか、それとも
ストック段階では「2Mコンテキスト」と書いたが、公式情報を確認した結果、これは現時点で確定情報ではない。
Gemini 3.5 Flash は1Mトークンコンテキスト。Pro が2Mに拡張されるという観測はサードパーティ予想ベースで、Google からの公式発表はまだない。ただし、Long-context ベンチマークでの-7.6ポイントの退行を Pro が埋めるなら、コンテキスト処理能力の根本的な見直しは必要で、容量拡大は十分にあり得る。
仮に2Mが実現すれば、これは商用モデルで最大級。書籍1,500ページ相当を一度に読ませることになる。RAG なしで巨大なコードベース全体を扱えたり、長期の医療記録・法務文書をモデルに直接渡せたりする「実用的に意味のある変化」になる。
価格戦略がブランド戦略になる
注目したいもう一つの軸が価格。
Gemini 3.5 Flash の API 価格は $1.50/$9.00(入力/出力、1Mトークンあたり)。これは Gemini 3.1 Pro の $1.25/$10 と比較すると、入力で若干上がり、出力では下がっている。
Proが「3.1 Proと同等価格」で出れば、Googleは「Flashが速くて安い、Proが頂上モデル」という整理。 逆に「Flashより数倍高い」価格設定なら、ProはOpus 4.8 や GPT-5.5 と真っ向勝負する「プレミアム推論層」の位置取り。
Anthropic Opus 4.8 が $15/$75(PartnerStack情報やAnthropic公式)、GPT-5.5 が $10/$50 程度の水準にいる中で、Google が Pro をどこに置くか。これが Google の「Gemini を Opus に並ぶブランドにするのか、Flash を主役にしてエッジ寄りで戦うのか」というアイデンティティ表明になる。
何が実現可能になるか
Gemini 3.5 Pro が「ハード推論の取り戻し」と「長コンテキストの拡大」を両立して出てきた場合、実用面でこんな変化が起こりうる。
- エージェント型ツールの設計が変わる — Cursor、Claude Code、Antigravity 等が「下書きはFlash、難所はPro」と切り替えながら動かす運用が現実的になる。1モデルで完結させる必要がなくなる
- 論文・長文ドキュメントの「全文渡し」が実用化する — 2Mコンテキストが実現すれば、RAG パイプラインの設計負担が大幅に減る。検索精度に依存せず、生コンテキストを丸投げできるパスが増える
- Gemini Ultra プランの再定義 — Deep Think が Pro 標準になると、Ultra プラン(月$250)の差別化要素が薄まる。Google は Ultra にさらに付加価値(Agentic Browser、Veo統合等)を盛る必要に迫られる
3つ目は Google にとって地味だが大きな話だ。Ultra の存在意義を維持するために、Pro 発表と同タイミングで Ultra に何か新機能を追加する可能性は高い。
微妙な点・懸念
期待値だけでなく、冷静に懸念も整理しておきたい。
「来月」の精度問題。 Google が「6月にロールアウト」と言っても、初週・最終週どちらでも嘘ではない。プレビュー → 限定GA → 全GA という段階的展開も予想されるため、「触れるけど API は限定的」みたいな中途半端な状態がしばらく続く可能性は高い。
Vertex AI先行か Gemini app 先行か。 3.1 Pro のときと同様、Pro は最初 Vertex AI(エンタープライズ向け)で限定提供され、Gemini app に降りてくるまでに時間差がある可能性がある。コンシューマーユーザーには「もう少し待たされる」展開になりがち。
ベンチマークの誇張リスク。 Flash が3.1 Pro を上回るベンチマークを選んで見せた前例があるように、Pro でも「都合の良いベンチマークで Opus 4.8 / GPT-5.5 を上回る」発表になる可能性は高い。発表直後の数字を額面通りに受け取らず、独立評価(lmarena.aiやSWE-bench Verified)が出てから判断するのが安全。
まとめ — Geminiの「2階建て体制」が完成するかどうか
5月の3.5 Flashで Google は「速さで殴る」体制を整えた。次の Pro リリースで、上から「重い思考」も取り戻せれば、Gemini は初めて「FlashとPro、2つの異なるモデルを使い分ける」フロンティア体制になる。
これは Anthropic(Opus / Sonnet / Haiku)の3層体制、OpenAI(GPT-5.5 / Mini / Nano)の3層体制と比べると、ややシンプル。だがGoogle にとっては「巨大モデル一本」から脱却し、用途別の最適化を本格的に始める転換点だ。
6月中に来ることはほぼ確実視されているが、具体的な日付は Google からの正式アナウンスを待つしかない。リリース後すぐに、Opus 4.8 と GPT-5.5 との実戦比較を取り上げる予定。それまでは、Flashを触りながら「Proで何が改善されたら自分の使い方が変わるか」を考えておくのが良い時間の使い方かもしれない。
関連記事
Flashなのにフラッグシップより速くて強い — Gemini 3.5 Flashが「安いモデル」の常識を壊した
Gemini 3.5 Flashはエージェント性能首位で4倍速。API価格Opusの1/10。使い分けを解説
Google I/O 2026、AI関連で注目すべき5つの発表予想 — Gemini 4はあるのか
Google I/O 2026(5月19-20日)のAI関連発表を先読み。Gemini 4の可能性、エージェントコーディング、Android 17のAI統合など注目ポイントを整理する。
Googleが研究者に「AI助手3人」を付けた — Gemini for Scienceの中身と、科学が変わる予感
Google I/O 2026で発表されたGemini for Scienceの3ツール——文献レビュー、仮説生成、計算科学——の仕組みと、研究現場で何が変わるかを解説。