Issue→コード→マージまで、デスクトップ1枚で完結する — GitHub Copilot Appが見せた「エージェント開発」の形
AIコーディングツールの勢力図が、また動いた。
2026年5月15日、GitHubがデスクトップネイティブの「GitHub Copilot App」をテクニカルプレビューとして公開した。VS Codeの拡張でもなく、ブラウザのダッシュボードでもない。IssueからPRのマージまでを1つのウィンドウで完結させるための、専用デスクトップアプリだ。

Claude Codeがターミナルを制し、OpenAI Codexがクラウドエージェントとして動き、Cursorがエディタごとリプレースした。そこにGitHubが「プラットフォーム丸ごと持ってるのは俺だ」と殴り込んできた格好になる。
Inboxという発想
このアプリで最も目を引くのは、コードエディタではなくInboxだ。
GitHub上のIssue、Pull Request、CIの失敗、レビューコメントがメールアプリのように一覧で並ぶ。開発者はInboxからタスクを選び、ワンクリックでエージェントセッションを起動する。「何をすべきか」を自分で探す工程がなくなる。
従来のAIコーディングツールはすべて「開発者がプロンプトを書く」ところから始まった。Copilot Appは「GitHubが仕事を教えてくれる」ところから始まる。この順序の逆転は地味に大きい。
並列セッションとAgent Merge
Copilot Appのセッションは完全に分離されている。セッションごとに独立したgit work tree、ブランチ、タスク状態を持つ。3つのIssueを同時に処理するなら、3つのセッションを並行して走らせればいい。途中でセッションを閉じても、次に開いたときにそのまま再開できる。
そしてAgent Merge。正直、ここが一番インパクトがある。
エージェントがPRを作成した後、Agent MergeをONにしておくと、レビューコメントへの対応、CIの失敗修正、マージコンフリクトの解消を自動で実行し、すべての条件をクリアしたら自動マージする。人間が見るのは最終的なdiffだけでいい。
「PRを出したけどCIが落ちて、直して、またコンフリクトが出て……」というあの繰り返しを、エージェントがバックグラウンドで片付けてくれる。開発のラストマイルが消える感覚だ。
スキルとワークフロー
Copilot Appでは、よく使うプロンプトやタスクを「スキル」として保存し、再利用できる。依存パッケージの更新、リリースノートの生成、リポジトリのトリアージ——こうした定型作業をスキル化すれば、チーム全体で同じ品質の自動化が回る。
MCPサーバーにも対応しているため、社内ツールやAPIとの接続も可能だ。GitHub Actionsのトリガーと組み合わせれば、Issueが立った瞬間にエージェントが動き出す、という運用もできる。
料金とアクセス
現時点ではテクニカルプレビュー。Copilot BusinessおよびEnterpriseのサブスクリプションがあれば、すぐにアプリをダウンロードして使い始められる。Copilot ProとPro+のユーザーはウェイトリストに登録する形になる。
追加料金は発表されていないが、エージェントの実行に別途クレジットが必要になる可能性は高い。Cursorが月$20のProプランでエージェント機能を提供し、Claude Codeが月$100〜$200のMax Planに含まれることを考えると、Copilotの価格設定は今後の注目ポイントになる。
Windows、macOS、Linuxの3プラットフォームに対応。
Claude Code、Codex、Cursorとどう違うのか
率直に言って、Copilot Appの最大の武器はGitHub自体がバックエンドにあることだ。
Claude Codeはターミナルで動くCLIエージェント。コードの理解力と修正力は圧倒的だが、Issueの一覧を眺めたりPRのCIステータスを追跡したりするには、別のツールかブラウザが必要になる。
OpenAI CodexはChatGPTアプリ内のクラウドエージェント。非同期でタスクを投げて結果を待つスタイルで、モバイルからも使える手軽さがある。ただし、リポジトリ内の開発フロー全体を管理するUIは持っていない。
Cursorはエディタ丸ごとAI化した「書く」ためのツール。コーディング体験としては最も洗練されているが、Issue管理やPRレビューの機能はGitHub側に依存している。
Copilot Appは、Issueを見て、コードを書かせて、PRを出して、CIを通して、マージする——この一連の流れをすべて1つのアプリに収めた。コーディングの質では個別ツールに負ける場面があるかもしれないが、「開発ワークフロー全体を1つのアプリで回す」という体験は他にない。
正直な所感
Agent Mergeは素直にすごい。PRのラストマイル問題は開発者なら誰もが経験する苦痛で、それをエージェントに丸投げできるなら生産性は確実に上がる。
一方で、テクニカルプレビューの段階でどこまで安定しているかは未知数だ。CIの修正を自動でやってくれるのは便利だが、「余計な修正をされた」「マージしてほしくなかったのに自動マージされた」というリスクもある。Agent Mergeの条件設定がどれだけ細かくできるかが、実用性を左右するだろう。
また、Copilot Appのエージェント実行にどのモデルが使われるかも気になる。現在のGitHub CopilotはAnthropicのClaude、GoogleのGemini、OpenAIのGPTを選択できるマルチモデル体制だが、デスクトップアプリのエージェントセッションで同じ柔軟性があるかどうかは公式には明らかにされていない。
これが意味すること
GitHubには1億5000万人の開発者がいる。その全員のIssue、PR、CIログ、コードレビューがGitHubのサーバーにある。Copilot Appは、そのデータに最も近い位置からエージェントを起動できるツールだ。
Claude CodeやCursorが「コードを書く」能力で勝負しているのに対し、Copilot Appは「開発プロセス全体を回す」ことで勝負しようとしている。両者が目指すゴールは同じ——開発者の生産性を上げること——だが、アプローチが明確に違う。
テクニカルプレビューの段階で確定的なことは言えないが、Agent Mergeとスキルの仕組みが安定すれば、チーム開発のハブとしてかなり強いポジションを取る可能性がある。個人の開発体験ではClaude CodeやCursorに軍配が上がる場面が多いとしても、「チームで使うならCopilot App」という棲み分けが生まれるかもしれない。
関連記事
SWE-benchでCursorもClaude Codeも抜いた「無名のツール」の正体 — Augment Intent
SWE-bench Proで51.8%の世界最高スコアを記録したAugment Code Intent。複数AIエージェントを束ねる「IDEの次」の設計思想と、Cursor・Claude Codeとの違いを解説。
Copilot CLIに「ラバーダック」がやってきた — 異なるモデル同士で相互レビューする時代
GitHub Copilot CLIの新機能「Rubber Duck」を解説。異なるモデルファミリーでプランとコードを相互レビューし、Sonnet→Opusの性能差の74.7%を埋める仕組みを整理する。
Cline SDKが出た — 500万人が使うVS Code拡張の「中身」がそのままオープンソースに
Cline SDKはVS Code拡張の内部エージェントランタイムをオープンソース化したもの。アーキテクチャ、プラグイン、Kanbanボード、Claude Code SDKとの違いを解説。