FlowTune Media

GitHub Copilotが「寝ている間に動くAI」になった — Workspace正式版の3つの自律モード

Claude Codeは自律的にコードを書ける。Cursor 3.6はAuto-reviewで承認を半自動化した。Devinはクラウド上でIssueを丸ごと片付ける。では、GitHub Copilotは?

長らくその問いに対する答えは「横で見ていないといけない」だった。提案はするが、実行するのは人間。Copilotは優秀な副操縦士であり続けたが、操縦桿を握ることはなかった。

Build 2026で、それが変わった。GitHub Copilot Workspaceが正式にGA(一般提供)となり、3つの自律実行モードを搭載してきた。

Fleet Mode — 承認なしで走り切る

Fleet Modeは、Copilot CLIから使える自律実行モードだ。スコープを絞ったコードベースタスク——テストの追加、リファクタリング、型定義の修正といった作業——を、ステップごとの承認なしで一気に処理する。

これまでのCopilotは、提案のたびに人間の確認を求めてきた。1ファイルずつ「これでいい?」と聞かれるのは安心感がある反面、作業のリズムが途切れる。Cursorが「Auto-review」で承認プロセスを自動化したのと同じ方向に、Copilotも踏み込んだ。

ただし、完全な野放しではない。あらかじめ許可されたツール(allowlist)はそのまま実行し、サンドボックス化可能な操作はサンドボックス内で走らせ、それ以外は分類エージェントが「通す」「別の方法を試す」「人間に聞く」を判断する。Cursor 3.6のAuto-reviewとほぼ同じアーキテクチャだ。

Autopilot Mode — 開発者がいなくても動く

Fleet Modeが「目の前のタスクを速く片付ける」ための機能だとすれば、Autopilot Modeは「開発者が離席している間にIssueを処理する」ための機能だ。

バックグラウンドで動作し、指定されたIssueに対して自律的にコードを書き、テストを走らせ、結果を報告する。開発者が月曜の朝にSlackを開いたら、週末に割り当てたバグ修正のPull Requestが出来上がっている——そういう使い方を想定している。

正直、これはDevinが先にやっていたことだ。Devinは2025年からクラウド上の自律コーディングを提供しており、Autopilot Modeは機能的にはその追従と言える。しかし、GitHubというプラットフォームに組み込まれている点が異なる。リポジトリの権限管理、CI/CDパイプライン、Issue管理がすべてGitHub上で完結するため、外部サービスとの連携を考える必要がない。

7月にはEnterprise顧客向けに「Autonomous Agent Mode」が予定されている。これはフィーチャーブランチ全体を自律的に構築し、テストしてコミットするモードだ。Autopilotの一段上——もはや「副操縦士」ではなく「操縦士」に近い。

Extensions — 外の世界と繋がる

3つ目はCopilot Extensions。Jira、Datadog、ServiceNowをWorkspaceセッション内から直接呼び出せるようにする。

例えばJiraのチケットを読み込み、その要件に沿ってコードを書き、Datadogのモニタリングデータを参照して本番のエラーパターンを確認し、ServiceNowのインシデントを更新する。1つのセッション内で開発ワークフローの上流から下流まで触れる。

MCPサーバー経由のツール連携が広がっているClaude Codeと比べると、Copilot Extensionsは統合の深さよりも「エンタープライズ向けの公式連携」にフォーカスしている。安定性と監査ログの優先度が高い大企業向けの設計だ。

料金の現実

ここで触れておくべき話がある。

Copilot Workspaceの自律実行機能は強力だが、6月1日から導入された従量課金制(AI Credits)のもとでは、ヘビーユーザーほどコストが膨らむ。Proプランの月額$10(約1,500円)で得られるクレジットでは、長時間のエージェントセッションを数回走らせるだけで使い切る可能性がある。

あるユーザーは、1回のエージェントセッションで$30〜$40のクレジットを消費したと報告している。Pro+プラン($39/月)でも心もとない水準だ。

つまり、Workspace GAは「使える機能」と「使い続けられるコスト」のギャップを抱えている。Fleet Modeでテストを自動追加するような短いタスクなら問題ないが、Autopilot Modeで大きなIssueを丸ごと任せるような使い方は、従量制のもとではコスト感覚と相談しながらになる。

Claude Code・Cursor・Devinと比べて

自律コーディングの選択肢が増えたことで、「結局どれを使うべきか」の問いがさらに複雑になった。

Claude Codeは、ターミナルベースの自律コーディングでは現時点で最も成熟している。Claude Opus 4.8の推論能力を使い、コードベース全体を理解した上で修正を提案・実行する。Copilot Workspaceとの最大の違いは、モデルの強さと柔軟性だ。ただし月額$200のMaxプランが前提になる場面も多い。

Cursor 3.6のAuto-reviewは、Fleet Modeと設計思想が似ている。分類エージェントが安全な操作を自動承認し、危険な操作のみ人間に聞く。IDEに統合されている分、日常の開発体験としてはシームレスだ。

Devinは、Autopilot Modeの直接的な競合だ。クラウド上で数時間から数日にわたって自律動作する点で、Copilotよりも先行している。ただしDevinは月額$500(約75,000円)からで、コスト面のハードルが高い。

Copilot Workspaceの強みは、GitHubとの密結合だ。Issue、PR、CI、コードレビューのすべてが同じプラットフォーム上にある。外部ツールとの連携コストがゼロに近い。世界中のほとんどの開発チームがすでにGitHubを使っている以上、この「すでにそこにある」というアドバンテージは大きい。

一方で、モデルの選択肢と推論品質では、Claude CodeやCursorに分がある。Project PolarisがGPT-4を置き換える8月以降、Copilotの推論品質がどう変わるかが次の焦点になる。

何が変わるのか

Copilot Workspaceの正式リリースは、自律コーディングが「先端的な選択肢」から「標準装備」に移行しつつあることを示している。Copilotのユーザーベースは470万人の有料ユーザーを含む巨大な規模だ。その全員がFleet ModeとAutopilot Modeにアクセスできるようになる。

既存のGitHubワークフローを壊さずに、段階的に自律度を上げられる設計は、保守的な開発チームにとっては最も受け入れやすい選択肢だろう。Claude CodeやDevinに乗り換えるのはハードルが高いが、すでに使っているCopilotの設定を1つ変えるだけなら、試してみようという気になる。

ただし、従量課金との折り合いをどうつけるかは、各チームが向き合うべき現実的な課題だ。自律AIに仕事を任せれば生産性は上がるが、使い方次第では月額が数万円に膨らむ。そのコストを正当化できるだけの成果を出せるかどうかが、Workspace GAの真価が問われるポイントになる。

関連記事