PCに6人のAIが常駐する — Tencent Marvisの実力と死角
待機中のAIエージェントが居眠りしたり、コーヒーを飲んだり、トイレに行ったりする。冗談ではなく、Tencent(テンセント)が2026年5月に公開したAIアシスタント「Marvis(马维斯)」の仕様だ。
Marvisは、Windows・Mac・Androidに対応するOS統合型のAIアシスタント。Microsoft CopilotやApple Intelligenceと同じ領域を狙っているが、アプローチがまるで違う。1つの万能AIではなく、6つの専門エージェントを「チーム」として常駐させる。しかも招待コード不要、1日あたり1000万トークンまで無料で使える。
日本語での情報がほぼ存在しないこのツール、何ができて何ができないのかを整理する。
6つのエージェントという設計思想
Marvisの核は、6つの専門エージェントによるチーム構成だ。
スーパーバイザーエージェントがユーザーの指示を受け取り、タスクを分解して適切なエージェントに振り分ける。残りの5つがそれぞれの専門領域を担う。
- ファイルエージェント — ファイルの検索・閲覧・編集・生成・フォーマット変換。画像内のテキスト検索や、人物・テーマ・場所で写真を分類するAIライブラリ機能も持つ
- コンピューターエージェント — システム設定の変更、スタートアップ項目の最適化、不要ファイルの削除、バッテリー状態やネットワーク情報の確認
- アプリエージェント — アプリケーションの操作を代行。デスクトップからモバイルアプリの操作も可能
- ブラウザエージェント — Webページの閲覧・情報収集・フォーム入力
- サーチエージェント — Web検索と情報の集約・要約
この構成が面白いのは、「1つのAIに全部やらせる」のではなく「専門家チームに仕事を割り振る」という人間の組織に近いモデルを採用している点だ。ファイル整理と Web検索は別のエージェントが並行して処理する。タスクが複雑になるほど、この分業の意味が出てくる。
アイコンのデザインもユニークで、各エージェントは角の生えた黒い子馬のキャラクター(通称「小牛马」)として描かれ、Tencentペンギンのマフラーを巻いている。仕事中は黙々とデスクに向かい、暇になると居眠りしたり体操したりコーヒーを飲んだりする。デスクトップの片隅で動くこのアニメーションは、「AIが裏で動いている」ことを視覚的に伝える仕掛けだ。
2つのモード:効率とプライバシーの使い分け
Marvisには2つの動作モードがある。
効率モードは、ローカル処理とクラウド推論を組み合わせるハイブリッド方式。日常的なタスク(ファイル整理、設定変更など)は端末側で処理し、複雑な指示の理解やプランニングはクラウドの大規模モデルに投げる。性能は高いが、データがクラウドに送られる。
プライバシーモードは、すべての処理を端末上で完結させる。データ解析、画像認識、対話のすべてがローカルで動き、一切のデータがクラウドに送信されない。オフライン環境でも動作する。
正直、このプライバシーモードの存在は大きい。金融・法務・人事など機密データを扱う業務では、「AIを使いたいが社外にデータを出せない」というジレンマが常にある。Microsoft Copilotも「データはテナント内に留まる」と説明するが、クラウドを経由すること自体がNGという組織は少なくない。Marvisのプライバシーモードは、その懸念を根本から解消する設計だ。
ただし、プライバシーモードではローカルの小規模モデルを使うため、効率モードと比べて回答の品質は落ちる。トレードオフはある。
何ができるのか — 実際のユースケース
海外メディアのハンズオンレビューから、具体的な使い方が見えてくる。
ファイル管理が得意分野の一つだ。「先月のPDFレポートを探して、要点を3行にまとめて」と言えば、ファイルエージェントがドライブ内を検索し、内容を要約する。契約書のレビューや大量の写真の分類も自然言語で指示できる。
システム管理も便利に見える。「バッテリーの劣化具合を教えて」「起動時に自動実行されるアプリを一覧にして、不要なものを止めて」といった操作が会話で完結する。PCに詳しくない人にとっては、設定画面を探し回る手間がなくなる。
クロスデバイス連携はTencentらしい機能だ。PCからモバイルアプリを操作し、モバイル側のプロセスを「クラウド監視」できる。WeChatエコシステムとの統合が前提にあるため、Tencent製品を使っている環境ではシームレスに動くだろう。
死角:速度と汎用性の壁
36krの実機レビューは、率直な評価を伝えている。「どれか一つの能力で圧倒するタイプではなく、集大成型の秘書」——つまり器用貧乏の側面がある。
最大の弱点は実行速度だ。複数のエージェントが順番にタスクを処理するため、単純なタスクでも3分以上かかるケースがあるという。1つのAIが直接処理するよりも、スーパーバイザーがタスクを分解→適切なエージェントに振り分け→結果を統合というステップが入る分、オーバーヘッドが大きい。
もう一つの制約はエコシステムへの依存だ。Tencent製品(WeChat、テンセントドキュメントなど)との連携が前提の設計になっているため、Google WorkspaceやMicrosoft 365中心の環境では恩恵が薄い。日本のビジネス環境ではこの点がネックになる可能性が高い。
また、日本語サポートの状況が不明確だ。中国市場向けにローンチされた製品であり、UIやエージェントの応答が日本語に対応しているかは公式に明言されていない。
Microsoft Copilot・Apple Intelligenceとの違い
OS統合型AIアシスタントは今、三つ巴の戦いになっている。Microsoft Copilotは「M365との統合」、Apple Intelligence(iOS 27のSiri)は「プライバシーファースト」、そしてMarvisは「マルチエージェント構成」で差別化する。
| 比較軸 | Microsoft Copilot | Apple Intelligence | Tencent Marvis |
|---|---|---|---|
| 構成 | 単一AI | 単一AI | 6エージェント |
| オフライン動作 | 不可 | 一部可能 | 完全対応 |
| 無料枠 | なし(M365サブ必須) | iOSに組み込み | 1000万トークン/日 |
| 対応OS | Windows中心 | Apple製品のみ | Win/Mac/Android |
| エコシステム | M365 | iCloud/Apple | WeChat/Tencent |
Marvisの「毎日1000万トークン無料」は破格だ。Microsoft Copilotは月額約4,500円(Microsoft 365 Copilot、税抜)、Apple Intelligenceは端末購入費に含まれるとはいえ対応機種が限られる。Marvisはダウンロードするだけで使い始められる。
ただし、Copilotの業務統合やAppleのプライバシー設計と比べると、Marvisは「何でもできるが、どれも浅い」という印象を受ける。深い統合よりも幅広いカバレッジを優先した設計だ。
可能性と見通し
Marvisのマルチエージェント構成は、将来的に面白い展開をもたらすかもしれない。
現状の6エージェントに加えて、サードパーティのエージェントを追加できる仕組みが実装されれば、ユーザーごとにカスタマイズされたAIチームが構築できる。たとえば経理担当なら「請求書エージェント」「経費精算エージェント」を追加する、といった拡張だ。MCPのような標準プロトコルとの統合が進めば、Tencent製品に閉じないオープンなエージェントプラットフォームになる可能性もある。
もう一つ気になるのは、このアーキテクチャが日本企業の「AI導入の入り口」になりうるかという点だ。「1つの万能AI」よりも「役割が明確な6人のチーム」という説明の方が、組織に馴染みやすい。プライバシーモードの存在も、慎重な日本企業にとっては安心材料になる。
もっとも、中国発のサービスに業務データを預けることへの抵抗感は無視できない。プライバシーモードなら端末内で完結するとはいえ、ソフトウェア自体がTencent製であることに対する不安は残るだろう。
Marvisが日本語に正式対応し、Tencentエコシステム外でも実用的に動くようになるかどうかが、日本市場での評価を分ける鍵になる。現時点では「こういうアプローチもあるのか」と知っておくべき存在であり、すぐに業務で使える段階ではない。
関連記事
WeChatの13億ユーザーにAIエージェントが届く — Tencent Hunyuan 3.0が意味すること
Tencentが次世代LLM Hunyuan 3.0を4月にリリース予定。300億パラメータ、WeChat AIエージェント統合、元OpenAI研究者が主導する開発体制を整理する。
Perplexity Personal Computer — 月額3万円で「AIがMacを操作する」は買いなのか
Perplexity Personal ComputerはMac上でファイル・アプリ・Webを横断操作するAIエージェント。月額$200の価値と制限を検証する。
OpenClawが午前3時に"夢を見て"記憶を整理するようになった — v2026.4.5が追加した3段階メモリと動画生成
OpenClaw v2026.4.5が4月5日リリース。Light/REM/Deepの3段階メモリ統合Dreaming、xAI・Wan・Runway動画生成バンドル、12言語UI、ClawHub 44,000スキルの実態を解説する。