FlowTune Media

Sundar Pichaiが「来月には」と言ったあのモデル — Gemini 3.5 Proが6月に来る

Gemini 3.5

5月19日のGoogle I/O 2026基調講演。Sundar Pichai氏が「Gemini 3.5を発表します」と切り出した瞬間、会場の期待は明らかにProモデルに向いていた。

ところが、当日リリースされたのはFlashだけ。Proについては「来月にお届けします」というアナウンスで、客席からは小さなため息が漏れた、と複数のメディアが報じている。

その「来月」が、いよいよ6月。Gemini 3.5 ProのGAは秒読み段階に入った。

何を待っているのか — Flashで分かったProの宿題

Gemini 3.5 Proを「期待されているフラッグシップ」と一言で片付けるのは簡単だが、なぜそれが必要かを Flash の数字を見て整理しておきたい。

Google公式ブログとWaveSpeed Blogの分析を突き合わせると、Gemini 3.5 Flashは速度・コーディング・エージェント系のベンチマークでは3.1 Proを上回っている。エージェント的なターミナルコーディングで76.2%、エージェント的なコンピュータユースで78.4%。これは確かにフロンティアレベルだ。

だが、いくつかの領域でFlashは3.1 Proに「明確に劣後」している。

ベンチマーク 3.5 Flash 3.1 Pro 差分
Humanity's Last Exam 40.2% 44.4% -4.2pt
ARC-AGI-2 72.1% 77.1% -5.0pt
Long-context(128K) 77.3% 84.9% -7.6pt

ハードな推論、抽象的なパターン認識、そして長コンテキストでの情報追跡 — このあたりがFlashの弱点として残された。

つまりGemini 3.5 Proは、Flashが意図的に切り捨てた「重い思考」をPro側で取り戻す役割を背負っている。Flashで速さとコストを取り、Proで知性のフロンティアを担う。Gemini 3シリーズが「1モデルですべて」だった構図から、明確に役割分担型に振った形だ。

注目したいのは「Deep Think」の有無

個人的に一番興味があるのは、Pro に Deep Think モードが標準搭載されるかどうかだ。

Deep Think は本来 Gemini 3 シリーズで導入された「複数経路の並行推論」モード。難問に対してモデルが複数の解法を同時に検討し、ベストなものを選び取る仕組みで、国際数学オリンピック級の問題で実績を出してきた(既存記事「Gemini 3 Deep ThinkがOlympiadで金メダル」参照)。

このモードは現状、AI Ultraサブスクライバー限定で、しかも別途モデルとして提供されている。3.5 Pro が標準でDeep Think相当の機能を内包するなら、AnthropicのExtended Thinking、OpenAIのo1系統に対するGoogleの正式回答になる。

逆に、Deep Think が別モデルのまま据え置かれた場合、Pro は単に「Flashの上位版」止まりで、フロンティア推論のリーダーシップは Opus 4.8 や GPT-5.5 寄りに留まる可能性がある。

コンテキスト長は1Mか、それとも

ストック段階では「2Mコンテキスト」と書いたが、公式情報を確認した結果、これは現時点で確定情報ではない。

Gemini 3.5 Flash は1Mトークンコンテキスト。Pro が2Mに拡張されるという観測はサードパーティ予想ベースで、Google からの公式発表はまだない。ただし、Long-context ベンチマークでの-7.6ポイントの退行を Pro が埋めるなら、コンテキスト処理能力の根本的な見直しは必要で、容量拡大は十分にあり得る。

仮に2Mが実現すれば、これは商用モデルで最大級。書籍1,500ページ相当を一度に読ませることになる。RAG なしで巨大なコードベース全体を扱えたり、長期の医療記録・法務文書をモデルに直接渡せたりする「実用的に意味のある変化」になる。

価格戦略がブランド戦略になる

注目したいもう一つの軸が価格。

Gemini 3.5 Flash の API 価格は $1.50/$9.00(入力/出力、1Mトークンあたり)。これは Gemini 3.1 Pro の $1.25/$10 と比較すると、入力で若干上がり、出力では下がっている。

Proが「3.1 Proと同等価格」で出れば、Googleは「Flashが速くて安い、Proが頂上モデル」という整理。 逆に「Flashより数倍高い」価格設定なら、ProはOpus 4.8 や GPT-5.5 と真っ向勝負する「プレミアム推論層」の位置取り。

Anthropic Opus 4.8 が $15/$75(PartnerStack情報やAnthropic公式)、GPT-5.5 が $10/$50 程度の水準にいる中で、Google が Pro をどこに置くか。これが Google の「Gemini を Opus に並ぶブランドにするのか、Flash を主役にしてエッジ寄りで戦うのか」というアイデンティティ表明になる。

何が実現可能になるか

Gemini 3.5 Pro が「ハード推論の取り戻し」と「長コンテキストの拡大」を両立して出てきた場合、実用面でこんな変化が起こりうる。

  1. エージェント型ツールの設計が変わる — Cursor、Claude Code、Antigravity 等が「下書きはFlash、難所はPro」と切り替えながら動かす運用が現実的になる。1モデルで完結させる必要がなくなる
  2. 論文・長文ドキュメントの「全文渡し」が実用化する — 2Mコンテキストが実現すれば、RAG パイプラインの設計負担が大幅に減る。検索精度に依存せず、生コンテキストを丸投げできるパスが増える
  3. Gemini Ultra プランの再定義 — Deep Think が Pro 標準になると、Ultra プラン(月$250)の差別化要素が薄まる。Google は Ultra にさらに付加価値(Agentic Browser、Veo統合等)を盛る必要に迫られる

3つ目は Google にとって地味だが大きな話だ。Ultra の存在意義を維持するために、Pro 発表と同タイミングで Ultra に何か新機能を追加する可能性は高い。

微妙な点・懸念

期待値だけでなく、冷静に懸念も整理しておきたい。

「来月」の精度問題。 Google が「6月にロールアウト」と言っても、初週・最終週どちらでも嘘ではない。プレビュー → 限定GA → 全GA という段階的展開も予想されるため、「触れるけど API は限定的」みたいな中途半端な状態がしばらく続く可能性は高い。

Vertex AI先行か Gemini app 先行か。 3.1 Pro のときと同様、Pro は最初 Vertex AI(エンタープライズ向け)で限定提供され、Gemini app に降りてくるまでに時間差がある可能性がある。コンシューマーユーザーには「もう少し待たされる」展開になりがち。

ベンチマークの誇張リスク。 Flash が3.1 Pro を上回るベンチマークを選んで見せた前例があるように、Pro でも「都合の良いベンチマークで Opus 4.8 / GPT-5.5 を上回る」発表になる可能性は高い。発表直後の数字を額面通りに受け取らず、独立評価(lmarena.aiやSWE-bench Verified)が出てから判断するのが安全。

まとめ — Geminiの「2階建て体制」が完成するかどうか

5月の3.5 Flashで Google は「速さで殴る」体制を整えた。次の Pro リリースで、上から「重い思考」も取り戻せれば、Gemini は初めて「FlashとPro、2つの異なるモデルを使い分ける」フロンティア体制になる。

これは Anthropic(Opus / Sonnet / Haiku)の3層体制、OpenAI(GPT-5.5 / Mini / Nano)の3層体制と比べると、ややシンプル。だがGoogle にとっては「巨大モデル一本」から脱却し、用途別の最適化を本格的に始める転換点だ。

6月中に来ることはほぼ確実視されているが、具体的な日付は Google からの正式アナウンスを待つしかない。リリース後すぐに、Opus 4.8 と GPT-5.5 との実戦比較を取り上げる予定。それまでは、Flashを触りながら「Proで何が改善されたら自分の使い方が変わるか」を考えておくのが良い時間の使い方かもしれない。

関連記事