FlowTune Media

OpenAI CodexがWindowsアプリを「操作」し始めた — ただし裏で動くのはMac限定

5月29日、OpenAIはCodexの「Computer Use」機能をWindowsに拡大した。4月にMacで先行リリースされていた機能が、ようやくデスクトップOSの多数派にも届いた形だ。

画面を見る。ボタンをクリックする。テキストフィールドに入力する。Codex Computer Useは、人間がPCの前でやることをそのまま代行するAIエージェントだ。対象はWindowsアプリ全般。ブラウザに限らず、ペイントでもExcelでもVisual StudioでもSlackでも、画面に表示されているものならCodexが触れる。

何ができて、何ができないか

Codex Computer Useの基本動作はシンプルだ。ChatGPTアプリ内でタスクを指示すると、Codexがデスクトップのスクリーンショットを取得し、視覚的に画面を解釈したうえで、マウスとキーボードの操作を返す。

公式デモでは「ペイントを開いてゴブリンを描いて」と指示すると、ペイントが起動し、カーソルが動き、なにやら小さなクリーチャーが出来上がる。見世物としては微笑ましいが、実用的なのはもう少し地味な場面だ。デスクトップアプリのUIテスト自動化、定型的なデータ入力作業、あるいはレガシーなWindowsアプリの操作代行あたりが現実的な使い所になる。

ただし、Windows版には大きな制約がある。フォアグラウンド限定だ。

Mac版ではバックグラウンドでの実行が可能で、ユーザーが別の作業をしている間もCodexが裏側でアプリを操作し続ける。さらにロック画面の状態でもタスクを続行できる「Locked Computer Use」がMac版には搭載されている。Windows版にはこのどちらもない。Codexが操作している間、そのPCは人間が使えない。

正直に言えば、これはかなり痛い。Perplexity Computerが「専用のMac miniで24時間走らせることを推奨」しているのと同じ問題が、Windows版ではさらに露骨に出る。

デスクトップエージェント三つ巴の構図

Computer Useの戦場は今、3つのプレイヤーが明確に分かれている。

OpenAI Codex: Mac・Windowsの両対応。コーディングとデスクトップ操作を統合したスーパーアプリ路線。スクリーンショットとDOMの両方を読む「コメントモード」内蔵ブラウザを持つ。スレッド管理でSlack・メール・PRの監視も可能。

Claude Computer Use: APIベースでOS非依存。サンドボックスが最も堅牢。開発者が自分の環境に組み込む前提の設計。Claude CodeやCoworkと連携して使うのが主流。

Perplexity Computer: Mac専用。検索とリサーチに特化。ローカルファイル・iMessage・カレンダーへのアクセスが強み。リサーチタスクでの精度は3つの中で最も高い。

各ツールのアーキテクチャ思想が違う。Codexは「何でもやるスーパーアプリ」、Claudeは「APIとして組み込むインフラ」、Perplexityは「検索から行動まで一気通貫」。ユーザーの用途次第で最適解が変わるため、単純な優劣はつけにくい。

スマホからの遠隔操作

Windows版でも、ChatGPTのiOS・Androidアプリからの遠隔操作に対応している。外出先からスマホでタスクを指示し、オフィスのWindows PCにCodexが作業を進める——という使い方が可能だ。既にCodex Mobileでカバーした機能だが、Windows対応によって使える場面が広がった。

ただし先述のとおり、Windows版はフォアグラウンド限定。PCの前に誰かがいて別の作業をしたくなったら、Codexのタスクは中断される。モバイルからの遠隔操作は「誰もPCを使っていない時間帯」にこそ価値がある。夜間のバッチ処理的な使い方が現実的だろう。

月額3,000円から使えるが、実用ラインは月1.5万円

利用にはChatGPT Plus(月額20ドル、約3,000円)以上のプランが必要。4月に新設されたPro 5x(月額100ドル)はPlusの5倍の利用枠があり、長時間のタスクをこなすなら実質ここがスタートラインだ。さらに上のPro 20x(月額200ドル)はヘビーユーザー向け。2026年4月からトークンベースの従量課金に移行しており、入力・キャッシュ入力・出力トークンごとにクレジットが消費される。

もうひとつ見過ごせないのが地域制限。EEA(欧州経済領域)、イギリス、スイスではComputer Use自体が利用不可だ。OpenAIは理由を公表していないが、EU AI規制法との関連が推測される。日本からは利用可能だが、今後の規制動向は注視しておいたほうがいい。

何が実現できるようになるか

Windows対応の本質は「市場の75%を占めるOSへの到達」だ。企業のPCはまだWindows比率が圧倒的に高い。バックグラウンド実行が加わり、EUでの利用制限が解除されれば、レガシーな社内ツールの操作自動化に使える場面は一気に増える。

ERPの定型入力、テスト環境でのUIリグレッション検出、複数ツール間のコピー&ペースト連携——APIが存在しない古いWindowsアプリこそ、Computer Useが輝くフィールドだ。人手でしか動かせなかった部分を、スクリーンショットベースの視覚AIが代行する。

フォアグラウンド制限の解消時期についてOpenAIは言及していない。Mac版は4月のリリースから約1ヶ月でバックグラウンド対応を追加した経緯がある。Windows版でも同様のタイムラインを期待したいが、確約はない。

バックグラウンド対応がいつ来るかで、このツールの評価は大きく変わる。フォアグラウンド限定のままでは「自動化」というより「代行を横で見守る」に近い。Mac版が辿った道を考えれば、数ヶ月以内に解消される可能性は十分ある。それまでは、夜間や離席中の限定運用で試しつつ、バックグラウンド対応を待つのが現実的な付き合い方だろう。

関連記事