FlowTune Media

Vertex AIはもう存在しない — Google Cloud Next 2026で始まった「エージェントのクラウド」の全容

4月22〜24日、ラスベガスで開催されたGoogle Cloud Next 2026。発表の総数は260件。だが、その中心にあるメッセージは1つだ。

Googleは「クラウド」を「エージェントのためのインフラ」に再定義した。

プレビュー記事で予測した「Agentic Cloud」路線は的中した。ただ、ここまで大胆に既存ブランドを捨てに来るとは思わなかった。本記事では、260の発表の中から実務に影響のある変更を整理する。

Vertex AIが消えた

もっとも象徴的な変更はこれだ。Vertex AIという名前が公式に廃止され、Gemini Enterprise Agent Platformに置き換わった。

名前が変わっただけではない。プラットフォームの設計思想が「モデルをホストして推論APIを返す場所」から「エージェントを構築・運用・監視する場所」に変わった。具体的には以下の4つの柱で構成される。

  • Agent Studio — ノーコードの視覚的ビルダー。自然言語で指示を書くだけで、トリガーベースのエージェントワークフローを作れる
  • Agent Gateway — エージェント間通信の管制塔。MCPとA2Aプロトコルのトラフィックを検査し、リアルタイムでポリシーを適用する
  • Agent Registry & Identity — 各エージェントに固有のIDを割り当て、ゼロトラストで認証する。人間と同じようにエージェントを管理するという発想
  • Agent Observability & Evaluation — LLMコールとMCPコール単位でのモニタリング。異常検知にはLLM-as-a-judgeを併用

正直、「Agent」が付く名前が多すぎて最初はカタログを眺めている気分になった。だが、これまでバラバラだったモデル管理・ワークフロー構築・ガバナンスが1つの管理画面に集約されること自体は歓迎すべき変化だ。

既存のVertex AIユーザーは段階的に移行が必要になる。Googleは互換レイヤーを用意しているとしているが、APIエンドポイント名やSDKの名前空間は変わるので、早めの確認をおすすめする。

第8世代TPU — 訓練と推論を別チップに分離

今回の発表で技術的にもっともインパクトが大きいのは、TPUを2つに分けたという決断だ。

TPU 8t(Training) は名前のとおり訓練専用。1チップあたり216GBのHBM、6.5TB/sの帯域幅、12.6ペタFLOPSの4ビット浮動小数点演算能力を持つ。最大9,600チップで2ペタバイトの共有メモリ空間を構成でき、前世代Ironwoodの約3倍のコンピュート性能を実現する。

TPU 8i(Inference) は推論とRL特化。レイテンシの低さとコスト効率に振ったチップで、MoEモデルのルーティング処理に最適化されている。性能あたりのコストは前世代比で最大80%改善。

これまでTPUは「訓練も推論も1つのチップで」が前提だった。チップを分離するという設計変更は、裏を返せば「訓練と推論では最適なハードウェアが根本的に違う」という認識をGoogleが公式に表明したことになる。

NVIDIAがH200からBlackwellへ推論性能を強化してきた流れと同じ方向だが、Googleは最初からチップごと別にした。潔い判断だと思う。

ネットワーク面ではVirgoと呼ばれる新ファブリックが発表され、134,000個のTPU 8tチップを非ブロッキングで接続できる。チップ間帯域は19.2Tbps。数字が大きすぎて実感が湧かないが、「GPT-5クラスのモデルを月単位ではなく週単位で訓練できる」というのがGoogleの説明だ。

A2Aプロトコル v1.0 が本番投入

エージェント同士が会話するための標準プロトコル「Agent-to-Agent(A2A)」がv1.0に到達し、150の組織で本番利用が始まった。

A2Aの立ち位置はこうだ。AnthropicのMCPが「エージェントとツールの接続」を担うのに対し、A2Aは「エージェント同士の通信」を担う。両者は競合ではなく補完関係にある。

実際、Agent GatewayはMCPとA2A両方のトラフィックをインラインで検査し、ポリシーを適用する設計になっている。Googleがこの2つを並列に扱っているのは注目に値する。MCPを潰しに行くのではなく、自分たちのプロトコルと共存させる戦略だ。

Agentic Defense — Wizとのセキュリティ統合

$32Bで買収したWizの統合がようやく具体的な形になった。

Agentic Defenseは、Google Threat IntelligenceとSecurity OperationsにWizのクラウドセキュリティプラットフォームを組み合わせたもの。エージェントの通信をModel Armorでインライン保護し、プロンプトインジェクション・ツールポイズニング・データ漏洩をリアルタイムで検出する。

セキュリティの問題が解決しないとエージェントの本番導入は進まない。そこにGoogleが買収した技術を投入してきたのは、「エージェント時代のセキュリティはうちが握る」という意思表示だろう。

Agentic Data Cloud — データをエージェントが使える形に

ストレージとデータベースの領域では、「Agentic Data Cloud」という新しいアーキテクチャが発表された。

目玉はKnowledge Catalog。企業のデータ資産をセマンティックに索引化し、エージェントがリアルタイムでアクセスできる「動的マップ」を作る。従来のデータカタログがメタデータの管理ツールだったのに対し、Knowledge Catalogはエージェントが「この質問に答えるにはどのデータソースを見ればいいか」を自律的に判断するための仕組みだ。

ストレージ性能も引き上げられた。Managed Lustreは10TB/sのスループットを実現。大規模モデルの訓練データ読み込みがボトルネックにならない水準だ。

Workspace Intelligence(既報)

Workspace Intelligenceについては発表翌日に詳報を出した。Gmail・Docs・Calendar・Driveを横断するセマンティックレイヤーで、Workspace全体を1つの「記憶」として扱える。

今回追加されたのは、Workspace Studioでカスタムスキルを作成してGemini経由でどのアプリからでも呼び出せる機能。たとえば請求書のチェックスキルを作れば、Gmailでも ChatでもDocsでも同じスキルが使える。Custom Agentsは5月3日まで無料トライアル中だ。

見えてきた全体像

260の発表を通して見えるのは、Googleが「クラウド」をコンピュート資源の貸し出しビジネスから、エージェント運用基盤ビジネスに転換しようとしている姿だ。

チップを訓練と推論で分離し、プラットフォームを「Agent」の名前で統一し、セキュリティにWizを投入し、通信プロトコルにA2Aを据え、データレイヤーにKnowledge Catalogを置く。個別に見ると地味な発表も多いが、全体を俯瞰するとGoogleが「エージェント時代のAWS」を目指していることが伝わってくる。

一方で、260もの発表がある割にはGeminiモデル自体のアップデートは控えめだった。5月のGoogle I/Oでの発表に回した可能性が高い。次はそちらに注目だ。

関連記事