Vertex AIはもう存在しない — Google Cloud Next 2026で始まった「エージェントのクラウド」の全容
4月22〜24日、ラスベガスで開催されたGoogle Cloud Next 2026。発表の総数は260件。だが、その中心にあるメッセージは1つだ。
Googleは「クラウド」を「エージェントのためのインフラ」に再定義した。
プレビュー記事で予測した「Agentic Cloud」路線は的中した。ただ、ここまで大胆に既存ブランドを捨てに来るとは思わなかった。本記事では、260の発表の中から実務に影響のある変更を整理する。
Vertex AIが消えた
もっとも象徴的な変更はこれだ。Vertex AIという名前が公式に廃止され、Gemini Enterprise Agent Platformに置き換わった。
名前が変わっただけではない。プラットフォームの設計思想が「モデルをホストして推論APIを返す場所」から「エージェントを構築・運用・監視する場所」に変わった。具体的には以下の4つの柱で構成される。
- Agent Studio — ノーコードの視覚的ビルダー。自然言語で指示を書くだけで、トリガーベースのエージェントワークフローを作れる
- Agent Gateway — エージェント間通信の管制塔。MCPとA2Aプロトコルのトラフィックを検査し、リアルタイムでポリシーを適用する
- Agent Registry & Identity — 各エージェントに固有のIDを割り当て、ゼロトラストで認証する。人間と同じようにエージェントを管理するという発想
- Agent Observability & Evaluation — LLMコールとMCPコール単位でのモニタリング。異常検知にはLLM-as-a-judgeを併用
正直、「Agent」が付く名前が多すぎて最初はカタログを眺めている気分になった。だが、これまでバラバラだったモデル管理・ワークフロー構築・ガバナンスが1つの管理画面に集約されること自体は歓迎すべき変化だ。
既存のVertex AIユーザーは段階的に移行が必要になる。Googleは互換レイヤーを用意しているとしているが、APIエンドポイント名やSDKの名前空間は変わるので、早めの確認をおすすめする。
第8世代TPU — 訓練と推論を別チップに分離
今回の発表で技術的にもっともインパクトが大きいのは、TPUを2つに分けたという決断だ。
TPU 8t(Training) は名前のとおり訓練専用。1チップあたり216GBのHBM、6.5TB/sの帯域幅、12.6ペタFLOPSの4ビット浮動小数点演算能力を持つ。最大9,600チップで2ペタバイトの共有メモリ空間を構成でき、前世代Ironwoodの約3倍のコンピュート性能を実現する。
TPU 8i(Inference) は推論とRL特化。レイテンシの低さとコスト効率に振ったチップで、MoEモデルのルーティング処理に最適化されている。性能あたりのコストは前世代比で最大80%改善。
これまでTPUは「訓練も推論も1つのチップで」が前提だった。チップを分離するという設計変更は、裏を返せば「訓練と推論では最適なハードウェアが根本的に違う」という認識をGoogleが公式に表明したことになる。
NVIDIAがH200からBlackwellへ推論性能を強化してきた流れと同じ方向だが、Googleは最初からチップごと別にした。潔い判断だと思う。
ネットワーク面ではVirgoと呼ばれる新ファブリックが発表され、134,000個のTPU 8tチップを非ブロッキングで接続できる。チップ間帯域は19.2Tbps。数字が大きすぎて実感が湧かないが、「GPT-5クラスのモデルを月単位ではなく週単位で訓練できる」というのがGoogleの説明だ。
A2Aプロトコル v1.0 が本番投入
エージェント同士が会話するための標準プロトコル「Agent-to-Agent(A2A)」がv1.0に到達し、150の組織で本番利用が始まった。
A2Aの立ち位置はこうだ。AnthropicのMCPが「エージェントとツールの接続」を担うのに対し、A2Aは「エージェント同士の通信」を担う。両者は競合ではなく補完関係にある。
実際、Agent GatewayはMCPとA2A両方のトラフィックをインラインで検査し、ポリシーを適用する設計になっている。Googleがこの2つを並列に扱っているのは注目に値する。MCPを潰しに行くのではなく、自分たちのプロトコルと共存させる戦略だ。
Agentic Defense — Wizとのセキュリティ統合
$32Bで買収したWizの統合がようやく具体的な形になった。
Agentic Defenseは、Google Threat IntelligenceとSecurity OperationsにWizのクラウドセキュリティプラットフォームを組み合わせたもの。エージェントの通信をModel Armorでインライン保護し、プロンプトインジェクション・ツールポイズニング・データ漏洩をリアルタイムで検出する。
セキュリティの問題が解決しないとエージェントの本番導入は進まない。そこにGoogleが買収した技術を投入してきたのは、「エージェント時代のセキュリティはうちが握る」という意思表示だろう。
Agentic Data Cloud — データをエージェントが使える形に
ストレージとデータベースの領域では、「Agentic Data Cloud」という新しいアーキテクチャが発表された。
目玉はKnowledge Catalog。企業のデータ資産をセマンティックに索引化し、エージェントがリアルタイムでアクセスできる「動的マップ」を作る。従来のデータカタログがメタデータの管理ツールだったのに対し、Knowledge Catalogはエージェントが「この質問に答えるにはどのデータソースを見ればいいか」を自律的に判断するための仕組みだ。
ストレージ性能も引き上げられた。Managed Lustreは10TB/sのスループットを実現。大規模モデルの訓練データ読み込みがボトルネックにならない水準だ。
Workspace Intelligence(既報)
Workspace Intelligenceについては発表翌日に詳報を出した。Gmail・Docs・Calendar・Driveを横断するセマンティックレイヤーで、Workspace全体を1つの「記憶」として扱える。
今回追加されたのは、Workspace Studioでカスタムスキルを作成してGemini経由でどのアプリからでも呼び出せる機能。たとえば請求書のチェックスキルを作れば、Gmailでも ChatでもDocsでも同じスキルが使える。Custom Agentsは5月3日まで無料トライアル中だ。
見えてきた全体像
260の発表を通して見えるのは、Googleが「クラウド」をコンピュート資源の貸し出しビジネスから、エージェント運用基盤ビジネスに転換しようとしている姿だ。
チップを訓練と推論で分離し、プラットフォームを「Agent」の名前で統一し、セキュリティにWizを投入し、通信プロトコルにA2Aを据え、データレイヤーにKnowledge Catalogを置く。個別に見ると地味な発表も多いが、全体を俯瞰するとGoogleが「エージェント時代のAWS」を目指していることが伝わってくる。
一方で、260もの発表がある割にはGeminiモデル自体のアップデートは控えめだった。5月のGoogle I/Oでの発表に回した可能性が高い。次はそちらに注目だ。
関連記事
Google Cloud Next 2026直前プレビュー — "Agentic Cloud"に賭けた5つの見どころ
2026年4月22〜24日に開催されるGoogle Cloud Next 2026の見どころをまとめた。7世代TPU Ironwood、エージェント基盤、Sundar Pichai登壇のキーノート、今年の裏テーマを事前に整理する。
メールもドキュメントも会議も、1つのAIが横断して読む — Google Workspace Intelligenceの狙い
Google Cloud Next 2026で発表されたWorkspace Intelligence。GmailやDocsを横断するAI層の仕組みと影響を整理。
Chromeが「もう一人の自分」になった — Google AI Modeで変わるブラウザの使い方
Google ChromeのAI Modeが大幅進化。分割画面でWebページを見ながらAIに質問、保存できるAI Skills、モデル切り替えなど新機能の使い方と活用法を整理する。