OpenAI CodexがWindowsアプリを「操作」し始めた — ただし裏で動くのはMac限定
5月29日、OpenAIはCodexの「Computer Use」機能をWindowsに拡大した。4月にMacで先行リリースされていた機能が、ようやくデスクトップOSの多数派にも届いた形だ。
画面を見る。ボタンをクリックする。テキストフィールドに入力する。Codex Computer Useは、人間がPCの前でやることをそのまま代行するAIエージェントだ。対象はWindowsアプリ全般。ブラウザに限らず、ペイントでもExcelでもVisual StudioでもSlackでも、画面に表示されているものならCodexが触れる。
何ができて、何ができないか
Codex Computer Useの基本動作はシンプルだ。ChatGPTアプリ内でタスクを指示すると、Codexがデスクトップのスクリーンショットを取得し、視覚的に画面を解釈したうえで、マウスとキーボードの操作を返す。
公式デモでは「ペイントを開いてゴブリンを描いて」と指示すると、ペイントが起動し、カーソルが動き、なにやら小さなクリーチャーが出来上がる。見世物としては微笑ましいが、実用的なのはもう少し地味な場面だ。デスクトップアプリのUIテスト自動化、定型的なデータ入力作業、あるいはレガシーなWindowsアプリの操作代行あたりが現実的な使い所になる。
ただし、Windows版には大きな制約がある。フォアグラウンド限定だ。
Mac版ではバックグラウンドでの実行が可能で、ユーザーが別の作業をしている間もCodexが裏側でアプリを操作し続ける。さらにロック画面の状態でもタスクを続行できる「Locked Computer Use」がMac版には搭載されている。Windows版にはこのどちらもない。Codexが操作している間、そのPCは人間が使えない。
正直に言えば、これはかなり痛い。Perplexity Computerが「専用のMac miniで24時間走らせることを推奨」しているのと同じ問題が、Windows版ではさらに露骨に出る。
デスクトップエージェント三つ巴の構図
Computer Useの戦場は今、3つのプレイヤーが明確に分かれている。
OpenAI Codex: Mac・Windowsの両対応。コーディングとデスクトップ操作を統合したスーパーアプリ路線。スクリーンショットとDOMの両方を読む「コメントモード」内蔵ブラウザを持つ。スレッド管理でSlack・メール・PRの監視も可能。
Claude Computer Use: APIベースでOS非依存。サンドボックスが最も堅牢。開発者が自分の環境に組み込む前提の設計。Claude CodeやCoworkと連携して使うのが主流。
Perplexity Computer: Mac専用。検索とリサーチに特化。ローカルファイル・iMessage・カレンダーへのアクセスが強み。リサーチタスクでの精度は3つの中で最も高い。
各ツールのアーキテクチャ思想が違う。Codexは「何でもやるスーパーアプリ」、Claudeは「APIとして組み込むインフラ」、Perplexityは「検索から行動まで一気通貫」。ユーザーの用途次第で最適解が変わるため、単純な優劣はつけにくい。
スマホからの遠隔操作
Windows版でも、ChatGPTのiOS・Androidアプリからの遠隔操作に対応している。外出先からスマホでタスクを指示し、オフィスのWindows PCにCodexが作業を進める——という使い方が可能だ。既にCodex Mobileでカバーした機能だが、Windows対応によって使える場面が広がった。
ただし先述のとおり、Windows版はフォアグラウンド限定。PCの前に誰かがいて別の作業をしたくなったら、Codexのタスクは中断される。モバイルからの遠隔操作は「誰もPCを使っていない時間帯」にこそ価値がある。夜間のバッチ処理的な使い方が現実的だろう。
月額3,000円から使えるが、実用ラインは月1.5万円
利用にはChatGPT Plus(月額20ドル、約3,000円)以上のプランが必要。4月に新設されたPro 5x(月額100ドル)はPlusの5倍の利用枠があり、長時間のタスクをこなすなら実質ここがスタートラインだ。さらに上のPro 20x(月額200ドル)はヘビーユーザー向け。2026年4月からトークンベースの従量課金に移行しており、入力・キャッシュ入力・出力トークンごとにクレジットが消費される。
もうひとつ見過ごせないのが地域制限。EEA(欧州経済領域)、イギリス、スイスではComputer Use自体が利用不可だ。OpenAIは理由を公表していないが、EU AI規制法との関連が推測される。日本からは利用可能だが、今後の規制動向は注視しておいたほうがいい。
何が実現できるようになるか
Windows対応の本質は「市場の75%を占めるOSへの到達」だ。企業のPCはまだWindows比率が圧倒的に高い。バックグラウンド実行が加わり、EUでの利用制限が解除されれば、レガシーな社内ツールの操作自動化に使える場面は一気に増える。
ERPの定型入力、テスト環境でのUIリグレッション検出、複数ツール間のコピー&ペースト連携——APIが存在しない古いWindowsアプリこそ、Computer Useが輝くフィールドだ。人手でしか動かせなかった部分を、スクリーンショットベースの視覚AIが代行する。
フォアグラウンド制限の解消時期についてOpenAIは言及していない。Mac版は4月のリリースから約1ヶ月でバックグラウンド対応を追加した経緯がある。Windows版でも同様のタイムラインを期待したいが、確約はない。
バックグラウンド対応がいつ来るかで、このツールの評価は大きく変わる。フォアグラウンド限定のままでは「自動化」というより「代行を横で見守る」に近い。Mac版が辿った道を考えれば、数ヶ月以内に解消される可能性は十分ある。それまでは、夜間や離席中の限定運用で試しつつ、バックグラウンド対応を待つのが現実的な付き合い方だろう。
関連記事
Codexがコーディングツールをやめた日 — OpenAIが62アプリ・6職種プラグインで狙う「全社員のAI」
OpenAI Codexが6つの職種別プラグインとSites機能を追加。62アプリ・110スキルで非エンジニアにも拡大するCodexの全貌と、ChatGPTとの棲み分けを解説。
OpenAIがCodexをエンジニア専用から「ホワイトカラー全員のAI」に変えに来た — 6プラグイン発表の中身
OpenAIがCodexに営業・データ分析・クリエイティブ・PE投資など6つの業務プラグインを追加。Codexの位置付けが「コーディングAI」から「業務エージェント基盤」に再定義された。
Macをロックして立ち去っても、Codexは作業を続けている — Goal Mode・Appshots・Locked Computer Use
OpenAI Codexの新機能3つを解説。Goal Modeで数日間の自律タスク、Appshotsで画面キャプチャ即共有、Locked Computer Useでロック中も作業継続。