GitHub Copilotが「100万トークン」を解放した — コンテキストと推論を自分で選ぶ時代へ
GitHub Copilotの1日のコスト感覚が変わりそうなアップデートが、6月4日のChangelogにさらっと載った。
1Mトークンのコンテキストウィンドウと、推論レベルの設定。どちらも「使える場面が明確で、使い方を間違えるとクレジットが溶ける」タイプの機能だ。
何が変わったのか
2つの変更が同時に入った。
1Mトークンコンテキスト。 Claude Opus 4.6、Opus 4.7のモデルバリアント(-1mサフィックス付き)で、入力80万トークン・出力6.4万トークンまでの巨大なコンテキストを扱えるようになった。VS Code、Copilot CLI、Copilot Appで利用可能。
推論レベルの手動設定。 モデルピッカーの「Thinking Effort」サブメニューから、low / medium / high / xhigh(一部モデルではmax)を選択できる。Claude Opus 4.6-1mはlow〜high、Opus 4.7-1m-internalはlow〜xhighに対応する。
簡単に言えば「どこまで深く考えさせるか」と「どこまで広く見せるか」を、開発者が自分で調整できるようになった。
正直、これは大きい
従来のGitHub Copilotは、コンテキストサイズもモデルの推論量も自動で決まっていた。ユーザーが介入する余地はなく、「賢いけど融通が利かない」状態だった。
今回の変更で、たとえばこういう使い分けができる。
日常的なコード補完やちょっとした質問には、デフォルトのコンテキストとlow〜mediumの推論レベル。クレジット消費を最小限に抑えられる。
一方で、数百ファイルにまたがるアーキテクチャの見直しや、複雑なバグの原因追跡には、1Mコンテキスト+high/xhighの推論を投入する。コストはかかるが、的外れな回答を何度もリトライするよりトータルでは安くつく。
この「状況に応じたギアチェンジ」は、Claude Codeの--fastフラグやCursorのThinking Mode設定でユーザーが自然にやっていたことだ。Copilotがようやく追いついた形になる。
クレジットの話をしよう
6月1日からGitHub Copilotはトークン従量課金に移行した。プランごとの月間クレジット上限は以下の通り。
| プラン | 月間AIクレジット |
|---|---|
| Pro | 1,500 |
| Pro+ | 7,000 |
| Business | 1,900 / ユーザー |
| Enterprise | 3,900 / ユーザー |
1AIクレジット = $0.01。つまりProプランで月$15相当、Pro+で$70相当だ。
ここに「1Mコンテキスト」と「高推論レベル」が加わると、1回のリクエストで消費するクレジットが跳ね上がる。Claude Opus 4.7の1Mバリアントに80万トークンを流し込んでxhighで回せば、1回の問い合わせでProプランの月間上限の相当部分を消費する計算になる。
正直に言って、Proプランの1,500クレジットで1Mコンテキストを常用するのは現実的ではない。この機能を日常的に使いたいなら、Pro+か組織プランが事実上の前提になる。
Cursor、Claude Codeとの立ち位置
GitHub Copilotの強みは「VS Codeにネイティブに統合されている」点に尽きる。追加のエディタもCLIも不要で、既存のワークフローを崩さずにAIコーディングを使える。
だが正直なところ、1Mコンテキスト+推論レベル設定という機能自体は目新しくない。Claude Codeは以前から1Mコンテキストで動作しているし、CursorのThinking Modeも推論の深さを調整できる。Copilotはこの2つの「当たり前」にようやく追いついた段階だ。
一方で、Copilotにはモデル選択の幅がある。Claude Opus、GPT-5.5、Gemini 3.5と主要モデルがすべて同じUIから切り替えられる。「タスクに応じてモデルを変え、推論レベルも変え、コンテキストサイズも変える」という3軸の調整ができるのはCopilotならではの利点だ。
使いどころの見極め
1Mコンテキストが活きる場面は限られている。「大きなコンテキスト = 常に良い結果」ではない。
1Mが有効なケース:
- モノレポ全体のアーキテクチャレビュー
- 複数パッケージにまたがる依存関係の追跡
- 大量のログやテスト結果を一度に食わせて原因を特定する
デフォルトで十分なケース:
- 単一ファイルの実装やリファクタリング
- APIドキュメントを参照しながらのコーディング
- コードレビューのコメント生成
推論レベルも同様で、highやxhighは「考える時間をかける価値がある問い」に限定したほうがいい。日常のコード補完にxhighを使うのはクレジットの無駄だ。
「月に数回の切り札」か、「日常のギア」か
Copilotが「ユーザーにコントロールを渡す」方向に舵を切ったのは歓迎できる。ただし、この機能をどう使えるかはプラン次第だ。Proプランの1,500クレジットでは1Mコンテキストは「月に数回の切り札」にしかならない。Pro+以上なら日常的な「ギアチェンジ」として運用できる。
VS Codeから離れずに、必要なときだけ「本気モード」を発動できる。Copilotユーザーにとって、それだけで十分に意味のある選択肢が増えた。
関連記事
Copilot CLIに「ラバーダック」がやってきた — 異なるモデル同士で相互レビューする時代
GitHub Copilot CLIの新機能「Rubber Duck」を解説。異なるモデルファミリーでプランとコードを相互レビューし、Sonnet→Opusの性能差の74.7%を埋める仕組みを整理する。
GitHub Copilotに「OpenAI由来じゃない自社モデル」が静かに入った — Claude Haiku 4.5を16ポイント上回るMAI-Code-1-Flash
Microsoftが6月2日に発表したコーディング特化モデル「MAI-Code-1-Flash」を解説。SWE-Bench Pro 51.2%とトークン60%削減を実現したCopilot内製モデルの実力と意味を整理する。
GitHub Copilotが「寝ている間に動くAI」になった — Workspace正式版の3つの自律モード
GitHub Copilot WorkspaceがBuild 2026で正式リリース。Fleet Mode、Autopilot Mode、Extensionsの3機能で自律コーディングに踏み出した中身を解説。