AIにPCを操作させる機能、設定ゼロで使えるようになった — Qwen Code v0.17
Computer Use — AIがマウスやキーボードを操作してPCのアプリケーションを動かす機能。AnthropicがClaude Opus 4.7で先行実装し、MicrosoftもCopilot Studio CUAとして提供を始めた。
ただ、これまでのComputer Useには共通の問題があった。セットアップが面倒すぎるのだ。
拡張機能のインストール、MCPサーバーの設定、権限の付与、ツールの再起動。この手順をすべて完走できるユーザーが少なすぎた。Qwen Code v0.17は、この問題を「設定ゼロ」で解決した。
確認ダイアログ1つで始まる
Qwen Code v0.17.0(6月4日リリース)では、Computer Useが組み込み機能として搭載された。
初回起動時にYes/Noの確認ダイアログが1つ出る。Yesを押すとバイナリのダウンロード、macOSのアクセシビリティ権限ガイド、MCPサーバーの起動まですべて自動で完了する。拡張機能の手動インストールも、設定ファイルの編集も不要だ。
裏側では、オープンソースのopen-computer-use MCPサーバーが9つのデスクトップ操作ツールを提供している。
click— マウスクリックtype_text— テキスト入力scroll— スクロールdrag— ドラッグ操作press_key— キーボードショートカットset_value— フォーム値の設定list_apps— 起動中アプリの一覧get_app_state— アプリの状態取得perform_secondary_action— 右クリック等
macOS、Linux、Windowsに対応。アクセシビリティAPIを経由するため、画面キャプチャベースの手法よりも安定して動作する。
モデルを選べるのが強み
Anthropicの Computer UseはClaude専用だ。Copilot Studio CUAもMicrosoftのモデルに紐づいている。
Qwen Codeは違う。バックエンドのモデルを自由に選べる。Qwen 3.7でもGPT-5.4でもClaude Opus 4.8でも、OpenAI互換のAPIを持つモデルなら何でも使える。コストの安い中国モデルでデスクトップ操作を試し、精度が必要な場面だけClaude に切り替える、といった使い分けが可能だ。
正直、Computer Use自体の精度はまだ発展途上で、複雑なGUI操作は失敗することも多い。だがこの機能が「設定ゼロ・無料・モデル非依存」で手に入るようになったことで、試すハードルは劇的に下がった。
どう使うか
現時点で実用的なのは、定型的なGUI操作の自動化だ。たとえばブラウザを開いて特定のページに移動し、フォームに値を入力して送信する。Excelのマクロでは自動化できない「別アプリをまたぐ操作」をAIに任せられる。
開発者にとっては、E2Eテストの自動化にも使える。Playwrightのようなテストフレームワークを書かなくても、「このボタンを押してこの画面が出ることを確認して」と自然言語で指示できる。まだ完璧とは言えないが、プロトタイプ段階のアプリのスモークテストには十分使えるレベルだ。
v0.17ではFeishu(飛書、ByteDanceのSlack的ツール)統合や、コンテキスト圧縮エンジンの書き直しも入っている。60以上のPRがマージされた大型アップデートだ。
関連記事
AIが昨日の会話を覚えている — Qwen Codeのセッション横断メモリが地味にすごい
Qwen Code v0.15.0のセッション横断メモリ機能を解説。過去の会話から技術スタックやコーディング規約を自動記憶し、次のセッションに引き継ぐ仕組みと、Claude Codeとの違いを整理する。
月$20のClaude Codeに対抗馬が現れた — 無料で使えるQwen Codeの実力
AlibabaのQwenチームが開発するオープンソースCLIコーディングエージェント「Qwen Code」。Claude CodeやCodex CLIとの違い、機能、使い方を整理する。
Codexが「ほぼ何でもやる」と言い出した — Mac操作・メモリ・90プラグインの全容
OpenAI Codexが4月16日にComputer Use・メモリ・90超プラグイン・内蔵ブラウザを追加。コーディングツールからスーパーアプリへ変貌した全容と、Claude Code・Cursorとの立ち位置の違いを解説する。