FlowTune Media

Google I/O直前にリークした「COSMO」 — スマホの中で動くAIアシスタントの正体

5月1日、GoogleのPlay Storeに見慣れないアプリが現れた。名前は「COSMO」。開発元はGoogle LLC。説明文には「AIの力をあなたのデバイスに直接届ける」とある。

47分後、アプリは消えた。

Google COSMO

9to5Googleが最初に気づき、記事を公開したのが午後1時44分(ET)。Googleがリスティングを取り下げたのが午後2時31分。その短い時間で、海外テックメディアが一斉にAPKを解析し、中身がかなり見えてしまった。

Google側は「accidental release」(誤公開)とだけコメントしている。Google I/O 2026は5月19日。18日前のリーク。偶然にしてはタイミングが良すぎる。

COSMOは「聞かれる前に動く」アシスタント

既存のGeminiアプリは、ユーザーがプロンプトを入力して初めて動く。COSMOは違う。デバイス上のアクティビティをモニタリングし、ユーザーが頼む前に提案してくる。Googleが「プロアクティブAIエージェント」と呼んでいるものの実装だ。

Androidの AccessibilityService API を使って画面の内容を読み取り、文脈に応じた「スキル」を自動で起動する仕組みになっている。ただし、テスターによるとこの機能は「まだ完全には動いていない」とのこと。研究段階のプロトタイプであることが窺える。

14のスキルを搭載

COSMOには、用途別に14のスキルがプリセットされている。いくつか注目すべきものを挙げる。

Calendar Event Suggester — 会話の中で「じゃあ木曜の3時に」と言ったのを検知して、カレンダーの予定作成を提案する。これはSiriやGoogle Assistantが何年も目指してきたことだが、COSMOではGemini Nanoの言語理解力がベースにある分、精度の桁が違う可能性がある。

Browser Agent — Googleの実験プロジェクト「Project Mariner」と連携し、Webブラウザ上のタスクを自動化する。フォーム入力、情報収集、ページ操作を代行できるらしい。

Deep Research — 複数のソースを横断して調査し、レポートを生成する。Gemini上のDeep Research機能と同系統だろうが、オンデバイスのコンテキスト(今見ているページ、最近の会話)と連動するのが新しい。

Document Writer — 手紙の起草やドキュメントの要約を提案する。

Conversation Recall — 過去の会話内容をメモリとして記憶し、後から呼び出せる。

ほとんどのスキルはデフォルトでオフになっており、ユーザーがトグルで有効にする設計。全部オンにすると、スマホが常にユーザーの行動を「見ている」状態になるわけで、プライバシーの観点からも慎重な導入になるだろう。

1.13GBアプリの中身 — Gemini Nanoがローカルで動く

COSMOの最大の特徴は、アプリサイズが1.13GBもあること。理由は明快で、Gemini Nanoモデルをまるごと内蔵している。

動作モードは3つ。

  • Hybrid — オンラインならサーバー側のモデル(PI)を使い、オフラインではNanoにフォールバック
  • PI Only — クラウド処理のみ
  • Nano Only — 完全オンデバイス

「PI」が何の略かは公式には明かされていないが、サーバーサイドのGeminiモデルを指していると見られる。

興味深いのは、Nano Onlyモードの存在だ。これが実用レベルで動くなら、飛行機の中でもAIアシスタントが使える。機内Wi-Fiの速度に依存しない、端末完結のAI体験になる。もちろんDeep ResearchのようなWeb検索が必要なスキルは使えないが、カレンダー提案やドキュメント作成など、ローカルデータだけで完結する機能なら問題ない。

正直な印象 — 荒削りだが方向性は正しい

UIは「かなり粗い」とAndroid Authorityが指摘している通り、現段階では製品として磨かれていない。Play Storeのスクリーンショットもアスペクト比が崩れた状態で掲載されていたらしく、うっかり公開してしまったことは間違いなさそうだ。

ただ、方向性は正しいと思う。今のAIアシスタントは「何か聞かないと何もしない」。それは便利だけど、「AIに何を聞けばいいか」をユーザーが考えなければならないという矛盾がある。COSMOのアプローチ — 状況を読んで先回りする — は、この矛盾を解消する筋の良い設計だ。

一方で、「スマホが常に画面を見ている」ことへの心理的抵抗は相当あるだろう。AccessibilityServiceを使うということは、画面上のすべてのテキスト、通知、操作をAIが読み取れるということだ。Googleのプライバシーポリシーとの整合性をどう取るのか、I/Oで明確なメッセージが必要になる。

Google I/O 2026で正式発表されるか

5月19日のI/Oまであと17日。COSMOがメインステージで発表されるのか、それともAndroid Policeが示唆するように「永遠に日の目を見ない研究プロジェクト」で終わるのかはわからない。

ただ、ひとつ言えるのは、AppleもSiri 2.0でプロアクティブAIへの転換を進めているということ。GoogleがCOSMOのコンセプトを捨てるとは考えにくい。むしろ、このリークによって期待値が上がった分、I/Oでの発表が前倒しになる可能性すらある。

オンデバイスAIは、クラウドへの依存を減らしつつ、プライバシーとレイテンシの両方を改善できる。Gemini Nanoの端末内実行が本当に実用レベルに達しているなら、それはスマホのAI体験を根本から変えるだろう。47分だけ公開されたアプリが、その序章だった可能性は十分にある。

関連記事