FlowTune Media

Gemini 3.1 Pro — 推論性能2倍、価格据え置き。Googleが仕掛けた静かな逆転劇

Gemini 3.1 Pro

ARC-AGI-2で77.1%。この数字がGemini 3.1 Proの立ち位置を端的に物語っている。Claude Opus 4.6が68.8%、GPT-5.2が52.9%。推論ベンチマークで、GoogleがOpenAIとAnthropicを明確に上回った。

2月19日にリリースされたGemini 3.1 Proは、18のベンチマーク中12で1位を獲得している。しかもAPI価格はGemini 3 Proと同じ$2/$12のまま。値上げなし。この「性能2倍、価格据え置き」という戦略は、LLM市場に静かだが確実なインパクトを与えている。

何が変わったのか

Gemini 3 Proからの最大の進化は推論能力だ。複雑な問題を段階的に分解し、論理的に解く力が劇的に向上した。Googleは「2倍以上の推論性能向上」と表現しているが、ARC-AGI-2のスコアを見ればそれが誇張でないことがわかる。

コンテキストウィンドウは1Mトークン(約100万語)、出力は最大65,536トークン。コードベース全体、8.4時間の音声、900ページのPDF、1時間の動画を一度に処理できる。マルチモーダル対応もGeminiの強みだ。

使い方のハードルが低い

Gemini 3.1 Proの魅力は性能だけではない。アクセスのしやすさも突出している。

Google AI Studio(aistudio.google.com)にGoogleアカウントでログインすれば、無料で試せる。APIキーの取得も数クリック。GeminiアプリからモデルをGemini 3.1 Proに切り替えるだけでも使える。NotebookLMでも利用可能だ。

月額プランでは、Google AI Proプラン(月額2,900円)に含まれる。Claude ProやGPT Plusと同価格帯で、この推論性能が使えるのは率直に言ってコスパが良い。

API料金は入力$2、出力$12(100万トークンあたり)。Claude Opus 4.6の$15/$75と比較すると、7〜6倍安い。

どこが強くて、どこが弱いか

強い点。論理的推論を必要とするタスクでは圧倒的だ。データ分析、数学的推論、コード内のバグ特定、複雑な条件分岐のロジック設計。こうした「深く考える」タスクでGemini 3.1 Proは他モデルを明確にリードする。

マルチモーダルも強い。長時間の動画を渡して「要約して」と言えるのは、現状Geminiだけの強みだ。

一方、弱い点。コードの生成品質では、Claude Opus 4.6のほうが安定している印象がある。SWE-benchのスコアは公表されていないが、筆者の体感ではClaudeのコードのほうが「そのまま動く」確率が高い。推論は強いがコーディングは別の話、ということだ。

日本語の文章生成は悪くないが、GPT-5.4のほうが自然な表現をする場面が多い。Geminiの日本語は正確だが少し翻訳調が残る。

3大モデルの使い分け

2026年4月時点での筆者の使い分けはこうだ。

  • 深い推論が必要な分析タスク: Gemini 3.1 Pro
  • コーディング: Claude Opus 4.6
  • 日本語の文章作成: GPT-5.4
  • コスト重視の大量処理: Gemini 3.1 Pro

万能なモデルはまだない。だが、Geminiがこの価格帯でこの推論性能を提供していることは、市場全体の価格圧力として健全に機能している。AnthropicもOpenAIも、いずれ価格を下げざるを得なくなるだろう。

Gemini公式サイト

関連記事