FlowTune Media

MCPだけでは足りなかった — AIエージェントの「画面側」を標準化するAG-UIプロトコル

AG-UI Protocol

MCPの登場でAIエージェントは外部ツールと自由に接続できるようになった。だが一つ、見落とされてきた穴がある。エージェントが動いている最中、ユーザーの画面には何を映すのか。途中で人間の承認が必要なとき、どうやって割り込むのか。

この「バックエンドからフロントエンドへの橋渡し」を標準化しようとしているのが、AG-UI(Agent-User Interaction Protocol)だ。開発したのはCopilotKit。5月5日にシリーズAで$27M(約40億円)を調達し、Google、Microsoft、AWS、LangChainをはじめとする主要プレイヤーが採用を始めている。

MCPとAG-UIは「補完関係」にある

ここを混同すると話がぐちゃぐちゃになるので、整理する。

  • MCP = エージェント ↔ ツール間のプロトコル(バックエンド層)
  • AG-UI = エージェント ↔ ユーザーアプリ間のプロトコル(フロントエンド層)

MCPは「エージェントが何をできるか」を決める。AG-UIは「エージェントの動きをユーザーにどう見せるか」を決める。レイヤーが違うから、競合ではなく併用する関係だ。

例えるなら、MCPが舞台裏の配線だとすると、AG-UIは舞台と客席をつなぐモニターとマイクのようなものだ。

16種類のイベントで「黒い箱」を開く

AG-UIの核心はシンプルだ。エージェントバックエンドが約16種類の標準イベントをHTTP SSEまたはWebSocketで発行し、フロントエンドがそれを消費する。

主なイベントタイプ:

  • TEXT_MESSAGE系 — テキスト生成の「タイピング中」表示をリアルタイムで
  • TOOL_CALL系 — ツール呼び出しの引数をストリーミング。UIに進捗を表示できる
  • STATE_SNAPSHOT / STATE_DELTA — スナップショット+差分パターンで状態同期
  • HUMAN_APPROVAL — 機密操作の前に人間の承認を要求

ポイントは、これが汎用プロトコルであること。フレームワーク依存しない。LangGraph、CrewAI、Pydantic AI、AWS Bedrock AgentCore——どのバックエンドでも同じイベントストリームを吐ける。

何が嬉しいのか——開発者目線で

「エージェントが裏で何かやってるけど画面が動かない」問題。これがAG-UIで解決する。

従来、AIエージェントの応答をUIに反映するには、各フレームワークごとに独自の接続コードを書く必要があった。LangChainを使うならLangChain専用のストリーミング実装、CrewAIなら別の方法。フロントエンドのReactコンポーネントもそれぞれ別物だ。

AG-UIが標準化されると:

  1. バックエンドを差し替えてもUIが壊れない — LangGraphからCrewAIに移行しても、フロントは同じAG-UIイベントを受け取るだけ
  2. 「人間の承認ゲート」が数行で実装できる — HUMAN_APPROVALイベントを飛ばすだけで、UIが自動的に承認ダイアログを出す
  3. ツール実行の進捗がリアルタイムに見える — 「データベースに書き込み中...」「APIを叩いています...」が勝手に画面に出る

正直、MCPの普及初期に「フロントエンド側の標準がないのは片手落ちだ」と感じていた開発者は多いはず。AG-UIはその空白を埋める。

採用状況が既にかなり広い

CopilotKitによると、Fortune 500企業の大部分が本番環境で使用中。具体名としてはDeutsche Telekom、DocuSign、Cisco、S&P Globalが公表されている。

技術スタック側の統合はさらに進んでいる:

  • AWS Bedrock AgentCore Runtime(2026年3月から対応)
  • Google ADK(Agent Development Kit)が公式統合を発表
  • Microsoft Agent Frameworkが統合ドキュメントを公開
  • LangGraph、CrewAI、Pydantic AI、Strands Agentsが対応済み

ファーストパーティのSDKはReactとAngular。コミュニティ主導でGolang、Rust、Javaのクライアントも出始めている。

CopilotKitそのものの立ち位置

AG-UIはオープンプロトコルだが、CopilotKit自体はAG-UIの上に構築されたフルスタックSDKだ。主にReactアプリケーションにAIコパイロットを組み込むためのコンポーネント群を提供する。

  • チャットUI(ストリーミング、ツールコール表示対応)
  • バックエンドツールレンダリング(エージェントのツール呼び出し結果をUIコンポーネントとして描画)
  • 状態同期レイヤー(エージェントとUIが同じステートを読み書き)
  • Generative UI(エージェントが実行時にUIを動的に生成)

GitHub上のスター数は約27,000。npmの週間インストール数は数百万に達しているという。

料金はフリーミアム。個人開発なら無料枠で試せる。

気になる点

プロトコル自体はオープンだが、実質的なリファレンス実装がCopilotKit一択になっている現状は気にかかる。MCPがAnthropic発でありながら多くの実装者を得たように、AG-UIにもCopilotKit以外のリファレンスが出てくるかが、本当の標準になれるかの分水嶺だろう。

また、GoogleのA2A(Agent-to-Agent)プロトコルやMCP-UIのような競合アプローチも存在する。エージェントプロトコルのレイヤーがまだ流動的で、今後の整理統合が起きる可能性はある。

MCP + AG-UIの組み合わせで広がる可能性

MCPでバックエンドを抽象化し、AG-UIでフロントエンドを抽象化する。この2層構成が定着すると、「AIエージェントのUIフレームワーク」という新しいカテゴリが本格的に立ち上がる。

例えば、社内の業務エージェントが経費精算APIをMCP経由で叩き、AG-UIのHUMAN_APPROVALイベントで上長の承認を求め、承認が降りたらそのままMCPで会計システムに書き込む——こうした「人間を挟んだ自動化」がフレームワーク側に標準で組み込まれる世界だ。

MCPだけの時代は「エージェントが何をできるか」だった。AG-UIが加わることで「エージェントがどう振る舞うか」も制御できるようになる。

AG-UI公式ドキュメント / CopilotKit GitHub

関連記事