FlowTune Media

GitHub Copilotが「100万トークン」を解放した — コンテキストと推論を自分で選ぶ時代へ

GitHub Copilotの1日のコスト感覚が変わりそうなアップデートが、6月4日のChangelogにさらっと載った。

1Mトークンのコンテキストウィンドウと、推論レベルの設定。どちらも「使える場面が明確で、使い方を間違えるとクレジットが溶ける」タイプの機能だ。

何が変わったのか

2つの変更が同時に入った。

1Mトークンコンテキスト。 Claude Opus 4.6、Opus 4.7のモデルバリアント(-1mサフィックス付き)で、入力80万トークン・出力6.4万トークンまでの巨大なコンテキストを扱えるようになった。VS Code、Copilot CLI、Copilot Appで利用可能。

推論レベルの手動設定。 モデルピッカーの「Thinking Effort」サブメニューから、low / medium / high / xhigh(一部モデルではmax)を選択できる。Claude Opus 4.6-1mはlow〜high、Opus 4.7-1m-internalはlow〜xhighに対応する。

簡単に言えば「どこまで深く考えさせるか」と「どこまで広く見せるか」を、開発者が自分で調整できるようになった。

正直、これは大きい

従来のGitHub Copilotは、コンテキストサイズもモデルの推論量も自動で決まっていた。ユーザーが介入する余地はなく、「賢いけど融通が利かない」状態だった。

今回の変更で、たとえばこういう使い分けができる。

日常的なコード補完やちょっとした質問には、デフォルトのコンテキストとlow〜mediumの推論レベル。クレジット消費を最小限に抑えられる。

一方で、数百ファイルにまたがるアーキテクチャの見直しや、複雑なバグの原因追跡には、1Mコンテキスト+high/xhighの推論を投入する。コストはかかるが、的外れな回答を何度もリトライするよりトータルでは安くつく。

この「状況に応じたギアチェンジ」は、Claude Codeの--fastフラグやCursorのThinking Mode設定でユーザーが自然にやっていたことだ。Copilotがようやく追いついた形になる。

クレジットの話をしよう

6月1日からGitHub Copilotはトークン従量課金に移行した。プランごとの月間クレジット上限は以下の通り。

プラン 月間AIクレジット
Pro 1,500
Pro+ 7,000
Business 1,900 / ユーザー
Enterprise 3,900 / ユーザー

1AIクレジット = $0.01。つまりProプランで月$15相当、Pro+で$70相当だ。

ここに「1Mコンテキスト」と「高推論レベル」が加わると、1回のリクエストで消費するクレジットが跳ね上がる。Claude Opus 4.7の1Mバリアントに80万トークンを流し込んでxhighで回せば、1回の問い合わせでProプランの月間上限の相当部分を消費する計算になる。

正直に言って、Proプランの1,500クレジットで1Mコンテキストを常用するのは現実的ではない。この機能を日常的に使いたいなら、Pro+か組織プランが事実上の前提になる。

Cursor、Claude Codeとの立ち位置

GitHub Copilotの強みは「VS Codeにネイティブに統合されている」点に尽きる。追加のエディタもCLIも不要で、既存のワークフローを崩さずにAIコーディングを使える。

だが正直なところ、1Mコンテキスト+推論レベル設定という機能自体は目新しくない。Claude Codeは以前から1Mコンテキストで動作しているし、CursorのThinking Modeも推論の深さを調整できる。Copilotはこの2つの「当たり前」にようやく追いついた段階だ。

一方で、Copilotにはモデル選択の幅がある。Claude Opus、GPT-5.5、Gemini 3.5と主要モデルがすべて同じUIから切り替えられる。「タスクに応じてモデルを変え、推論レベルも変え、コンテキストサイズも変える」という3軸の調整ができるのはCopilotならではの利点だ。

使いどころの見極め

1Mコンテキストが活きる場面は限られている。「大きなコンテキスト = 常に良い結果」ではない。

1Mが有効なケース:

  • モノレポ全体のアーキテクチャレビュー
  • 複数パッケージにまたがる依存関係の追跡
  • 大量のログやテスト結果を一度に食わせて原因を特定する

デフォルトで十分なケース:

  • 単一ファイルの実装やリファクタリング
  • APIドキュメントを参照しながらのコーディング
  • コードレビューのコメント生成

推論レベルも同様で、highやxhighは「考える時間をかける価値がある問い」に限定したほうがいい。日常のコード補完にxhighを使うのはクレジットの無駄だ。

「月に数回の切り札」か、「日常のギア」か

Copilotが「ユーザーにコントロールを渡す」方向に舵を切ったのは歓迎できる。ただし、この機能をどう使えるかはプラン次第だ。Proプランの1,500クレジットでは1Mコンテキストは「月に数回の切り札」にしかならない。Pro+以上なら日常的な「ギアチェンジ」として運用できる。

VS Codeから離れずに、必要なときだけ「本気モード」を発動できる。Copilotユーザーにとって、それだけで十分に意味のある選択肢が増えた。

関連記事