FlowTune Media

AIエージェントに「インフラごと」渡す — Cloudflare Agents Weekで発表された5つの基盤

AIエージェントを作る側にとって、モデルの性能はもう十分だ。足りないのは「安全に動かせる場所」のほう。

2026年4月13〜17日、CloudflareはAgents Weekと題して5つのプロダクトを一挙に発表した。ネットワーク、サンドボックス、実行フレームワーク、推論ゲートウェイ、ブラウザ操作。エージェントが必要とする基盤をまるごと揃えた格好だ。

正直、1つ1つは地味に見える。だが組み合わせて眺めると「エージェントをプロダクションで動かすときに何が要るか」を、インフラ企業の視点で整理しきったと感じる。

Mesh — エージェント同士を繋ぐプライベートネットワーク

Cloudflare Meshは、AIエージェント・人間・マルチクラウドのリソースを1つの暗号化されたネットワークに束ねるサービスだ。

VPNやトンネルを手動で張る必要がない。Cloudflare OneのZero Trustプラットフォームと統合されているため、エージェントがプライベートDBやAPIにアクセスする際もポリシーベースで制御できる。

従来、マルチエージェント構成を組むと「Agent AがAgent Bの内部APIを叩く」だけでネットワーク設計が面倒だった。Meshはそこを宣言的に解決する。Workers VPCとも連携するので、既存のCloudflareユーザーなら移行コストは低い。

Sandboxes GA — コードを実行させるなら隔離環境で

エージェントにコードを書かせ、そのまま実行させる流れが一般化しつつある。だが「LLMが生成したコードをホスト上でそのまま走らせる」ことのリスクは言うまでもない。

Cloudflare Sandboxesは、隔離されたLinux環境をオンデマンドで立ち上げ、エージェントのコード実行を閉じ込める。GA(一般提供)になったことで、プロダクション利用が現実的になった。

各サンドボックスはネットワークアクセスやファイルシステムを制限でき、実行が終われば破棄される。Claude CodeやCodexが行う「生成→テスト→修正」のループを、クラウド側で安全に回す基盤として使える。

Think SDK — 長時間エージェントのためのフレームワーク

Project Thinkは、数分〜数日にわたって動き続けるエージェント向けの実行基盤だ。

チャットボット用フレームワーク(LangChain等)とは設計思想が異なる。Think SDKは以下を標準で持つ:

  • Durable Execution: クラッシュ復旧、チェックポイント、自動キープアライブ
  • Sub-agents: 子エージェントに独自のSQLiteデータベースと型付きRPCを付与し、Durable Objectsで管理
  • Persistent Sessions: ツリー構造のメッセージ、フォーク、圧縮、全文検索
  • Sandboxed Code Execution: Dynamic Workersによる安全なコード実行

LLMに「明日の朝もう一度この処理を確認して」と言えるエージェントを作りたいなら、Think SDKのDurable Executionがそれを支える。状態永続化やタスクの中断・再開をフレームワークが面倒を見てくれる。

AI Gateway — 70+モデルを1エンドポイントで

AI Gatewayは、OpenAI、Anthropic、Google、Groq、xAIなど12以上のプロバイダー、70以上のモデルへの推論リクエストを1つのAPIエンドポイントに集約するプロキシだ。

単なるルーティングだけでなく、以下の機能がある:

  • 自動フェイルオーバー: プロバイダー障害時に別プロバイダーへ自動ルーティング
  • Unified Billing: 複数プロバイダーの課金をCloudflare一括請求に統合
  • コスト可視化: トークン使用量・費用をダッシュボードでリアルタイム確認
  • レート制限・キャッシュ: 同じリクエストの重複課金を防止

基本機能は無料。Workers Freeプランで月10万ログ、Workers Paidで月100万ログまで。モデル自体のトークン課金は別途かかるが、Gateway自体のコストはほぼゼロで試せる。

Browser Run — エージェントにブラウザを持たせる

Browser Runは、従来の「Browser Rendering」のリブランド+大幅機能追加だ。Cloudflareのグローバルネットワーク上でヘッドレスChromeを起動し、エージェントに「Webブラウジング能力」を与える。

目玉はLive View。エージェントがブラウザ上で何をしているかをリアルタイムに確認できる。ダッシュボードからDOMやコンソール、ネットワークリクエストが丸見えになる。

さらにHuman in the Loopに対応している。ログインページや予想外のCAPTCHAにぶつかったとき、エージェントが人間にバトンタッチできる。人間が解決したら、エージェントに操作を戻す。

もう1つ注目したいのがWebMCPサポート。Webサイトが構造化されたツール(searchFlights()bookTicket()等)をAIエージェント向けに公開できる仕組みで、スクリーンショット→解析→クリックという遅いループを省略できる。

5つ組み合わせると何が起きるか

個別に見ると「まあ、あると便利だよね」程度に感じるかもしれない。だが5つを組み合わせると、1つのシナリオが浮かぶ。

Think SDKで永続エージェントを構築し、AI Gatewayで最適なモデルを選択し、Sandboxesでコードを安全に実行し、Browser Runでブラウザ操作を行い、Meshで他のエージェントやプライベートインフラと接続する。

たとえば「毎朝、社内DBから売上データを取得→分析レポートを生成→Slackに投稿→異常値があれば関連Webページを調査して要因推定」という一連の流れを、エージェント1つに任せきれる。しかもフェイルセーフ込みで。

現時点では、こうした「フルスタックのエージェントインフラ」を1社で提供できるのはCloudflareくらいだろう。AWSやGCPにも個別サービスはあるが、エージェント最適化の設計思想で統合されているのが強い。

微妙な点

開発者向けの基盤であり、非エンジニアが直接触るものではない。Think SDKはまだ設計が若く、LangGraphやCrewAIのようなエコシステムの厚みは今のところない。

また、Cloudflareに依存しすぎるロックインのリスクはある。Mesh + Sandboxes + Think SDK + Browser Runを全部使うと、移行先の選択肢が狭まる。

まとめ

Cloudflare Agents Weekの発表は、「AIエージェントを本番環境で安全に動かすには何が必要か」という問いへの、インフラ企業からの回答だ。モデルの精度ではなく、モデルの「住む場所」を整えにきた。

2026年後半にはCursorやClaude Codeのようなコーディングエージェントが、裏でCloudflareのSandboxesやBrowser Runを使って動く世界が普通になるかもしれない。基盤レイヤーの動きは地味だが、その上に乗るアプリの可能性を決める。

関連記事