GitHub Copilot CLIがBYOK対応 — 自前のAPIキーとローカルモデルで、Copilotの課金から降りられる

「Copilotを使いたいが、GitHubにコードを送り続けるのが嫌だ」——そういう開発者は、思っているより多い。

4月7日、GitHubがCopilot CLIにBYOK（Bring Your Own Key）とローカルモデル接続をサポートした。一言で言えば、GitHub Copilotのサブスクリプションなしに、自分で用意したAPIキーやローカルで動かしたモデルをCopilot CLIに繋いで使えるようになった。

地味なアップデートのように見えて、これはかなりの方向転換だ。

何ができるようになったのか

Copilot CLIはこれまで、GitHubのモデルルーティング経由で動いていた。BYOK対応により、この経路をバイパスして自分のLLMプロバイダーに直接繋げる。

対応プロバイダーはAzure OpenAI、Anthropic、そして「OpenAI互換エンドポイント」ならなんでも。いくつかの環境変数を設定してCLIを起動するだけで切り替えられる。リモートAPIだけでなく、Ollama、vLLM、Foundry Localといったローカルで動かすモデルサーバーも対象に入っている。

そしてCOPILOT_OFFLINE=trueを設定すると、Copilot CLIはGitHubのサーバーに一切通信しなくなる。テレメトリも無効化される。ローカルモデルと組み合わせれば、インターネット接続なしで完全オフラインのAI開発環境が作れる。

驚いたのは「GitHubの認証すら不要になる」点だ。自分のプロバイダーを使う場合、GitHubアカウントにログインしなくてもCopilot CLIを起動できる。

ローカルモデルの要件

何でも繋がるわけではなく、モデル側の条件はある。ツールコールとストリーミングのサポートが必須。コンテキストウィンドウは最低でも128Kトークン推奨。これを下回るモデルだと、複雑なエージェントタスクでコンテキストが溢れやすくなる。

現実的には、Llama系の最新世代（Llama 4 Scout/Maverick）やQwen 2.5-Coderあたりが対象になるだろう。8Bや14B程度の小型モデルだとツールコールの精度が落ちる可能性があり、そのあたりは試してみるしかない。

4月の怒涛のアップデートの中での位置付け

BYOKの発表は、GitHubにとって慌ただしい1週間の締めくくりだった。

4月2日にはOrganization向けカスタムインストラクションのGA。管理者がOrganization全体に適用されるシステムプロンプトを設定できる機能で、社内コーディング規約やアーキテクチャのルールをCopilot全体に一括適用できる。

同日、Copilot SDKのPublic Preview（別記事で解説済み）。4月4日にはCopilot CLI Criticエージェントの発表。Criticはコードレビューに特化したエージェントで、変更差分を渡すとバグ・セキュリティ問題・パフォーマンス改善点を指摘してくれる。

そして7日のBYOK。1週間で4つ。GitHubの開発ペースが上がっている。

正直なところ、誰に刺さるのか

BYOKの恩恵を受けるのは、主に3つのパターンだと思う。

エアギャップ環境が必要な組織。金融・防衛・医療系など、コードを外部に送れないセキュリティ要件を持つ企業がある。今まで「Copilotを使いたいが使えない」だったところが、これで選択肢に入る。

APIコストをGitHubに払いたくない開発者。$10〜$39/月のCopilotサブスクリプションより、自分で直接OpenAIやAnthropicのAPIを使ったほうが使い方によっては安くなる。重課金ユーザーなら特に。

モデルを選びたい開発者。GitHubがどのモデルを裏で使っているかを気にせず、「自分はGPT-5.4がいい」「Claudeを使いたい」「Qwen 2.5-Coderの方が自分のコードベースに合っている」という選択ができる。

逆に、特に不満もなくCopilotを使っている人には関係ない話だ。設定の手間が増えるだけで、メリットが少ない。

微妙な点も書いておく

BYOK対応は嬉しいが、セットアップが「環境変数を数個設定する」という現在の仕様のまま運用するのは、チームレベルでは面倒だ。特にOrganization展開を考えると、設定管理の煩雑さが新たな運用コストになりかねない。

また、GitHubが提供するモデルルーティングの恩恵（プロバイダー障害時の自動フォールバック、最適モデルの自動選択など）は、BYOKに切り替えると失われる。「柔軟性と引き換えに安定性を手放す」という判断を、使う側が意識してする必要がある。

ローカルモデルについても現実的な視点が必要で、128Kコンテキスト＋ツールコール対応のモデルをまともなスピードで動かすには、それなりのGPUが要る。M3 Max以上のMacか、RTX 4080以上の環境がないと、「ローカルで動かしてみたけど遅すぎて使えない」という体験になりやすい。

Copilotがプラットフォーム化している

ここ1週間のアップデートを並べると、GitHubの意図がはっきり見える。

CopilotはもはやVS Codeのエクステンションという話ではない。SDK、BYOK、カスタムインストラクション、Critic——これらはCopilotをエコシステムの中心に据えるための部品だ。GitHubを使う組織がCopilotのAPIとランタイムを基盤に使い、その上に独自のワークフローを構築する。そういう世界を目指している。

BYOKはその一部に過ぎないが、「Copilotのサブスクリプションを持っていない人でも、Copilotのエージェント基盤を使える」という間口の広げ方は、プラットフォーム戦略として正しいと思う。

今すぐ必要な人は多くないかもしれないが、Copilot CLIをより深く使い込もうとしている開発者なら、BYOKの設定を一度試しておく価値はある。

GitHub Copilot CLI
Copilot CLI BYOK ドキュメント

GitHub Copilot CLIがBYOK対応 — 自前のAPIキーとローカルモデルで、Copilotの課金から降りられる

何ができるようになったのか

ローカルモデルの要件

4月の怒涛のアップデートの中での位置付け

正直なところ、誰に刺さるのか

微妙な点も書いておく

Copilotがプラットフォーム化している

関連記事

GitHub Copilot Agent Mode — Issueを投げたらPRが返ってくる。その精度は？

GitHub Copilot SDK — AIエージェントを「自分のアプリ」に組み込める時代が来た

CognitionがDevin向けにSWE-1.6をリリース——性能だけでなく「使い心地」を本気で鍛えたモデル