FlowTune Media

Macをロックして立ち去っても、Codexは作業を続けている — Goal Mode・Appshots・Locked Computer Use

ノートPCの蓋を閉じて会議に向かう。戻ってきたらPRが出来上がっている。

冗談のような話だが、5月21日にOpenAIがCodexに追加した3つの機能は、まさにこのシナリオを実現しようとしている。Goal Mode(GA)、Appshots、Locked Computer Use。それぞれ別の問題を解くが、3つ合わせると「人間がいなくてもAIが作業し続ける」方向に一歩踏み出している。

Goal Mode:「終わるまでやっておいて」が通じるようになった

Goal Modeは以前からベータで存在していたが、5月21日に正式版になった。Codexアプリ、IDE拡張、CLIのすべてで使える。

従来のAIコーディングは「チャットで指示→コードを生成→確認→次の指示」の繰り返しだった。Goal Modeは違う。完了条件を定義し、Codexにその状態まで自律的に進ませる。

CLIでは /goal コマンドで起動する。「全テストがパスし、カバレッジが80%以上になる状態」のように、達成すべき条件を記述する。Codexはその条件に向かって自分でコードを書き、テストを走らせ、失敗したら修正し、を繰り返す。数時間、場合によっては数日にわたって動き続ける。

セッションの中断にも強い。ネットワークが切れたり、トークン予算が尽きたりしても、Goalは永続化されている。接続が戻れば途中から再開する。

これはClaude Codeの /goal コマンドと明らかに同じ方向を向いている。「1回のプロンプトで1つの応答」というチャットの枠を超え、エージェントに「目標」を渡して放置するスタイルが、AIコーディングの新しい標準になりつつある。

Appshots:今見ている画面を、2キーでAIに渡す

Appshotsは地味だが実用的だ。

MacでCommand + Commandを押すと、現在のアプリウィンドウのスクリーンショットとテキスト情報がCodexのスレッドに添付される。「このエラー画面を見て」「このデザインの通りに実装して」といったやりとりが、ファイルをドラッグ&ドロップすることなく2キーで済む。

AIコーディングツールで「今見ているもの」を伝えるのは地味に面倒だった。URLをコピーしてペーストする、スクリーンショットを撮ってアップロードする。Appshotsはそのステップをショートカットキー1つに圧縮した。

小さな改善だが、1日に何十回とAIに指示を出すユーザーにとっては、摩擦の削減量は馬鹿にならない。

Locked Computer Use:ロック中でも手を動かし続けるAI

3つのなかで最もインパクトがあるのはこれだろう。

Codexは以前からmacOS上でComputer Use(画面を見てマウスとキーボードを操作する機能)に対応していた。しかし、Macがロックされると当然ながら操作できなくなる。ロック中は画面が消え、入力を受け付けないからだ。

5月21日のアップデートで、CodexはMacがロックされた状態でも作業を継続できるようになった。Appleの認証プラグインを使い、エージェントが一時的にロックを解除して操作を続ける。

セキュリティが気になるところだが、いくつかのセーフガードが入っている。認証は短期間で失効し、ディスプレイはカバーされた状態で操作が行われる。ローカルで人間が入力を行うと即座にロックが復帰する。要するに「人間がいない間だけ、必要最小限のアクセスを許可する」設計だ。

正直に言えば、「PCを放置してAIに操作させる」ことに心理的な抵抗を感じる人は少なくないだろう。物理デバイスの制御をAIに渡すことの是非は、技術的な安全性とは別の議論だ。ただ、長時間かかるE2Eテストの実行や、複数アプリをまたぐ定型作業を夜間に回しておけるのは、使い方次第で相当便利になる。

Claude Codeとの「放置AI」競争

興味深いのは、Claude Codeがほぼ同時期に類似機能を出していることだ。Claude Code v2.1の「Agent View」は複数セッションの一画面管理を実現し、/goal コマンドで完了条件を設定した自律実行が可能になった。

Codexの3機能とClaude Codeの方向性は驚くほど似ている。両社とも「人間が見ていなくても、AIが自律的に作業を完了させる」世界を作ろうとしている。Codexは物理デバイスの操作(Locked Computer Use)で差別化し、Claude Codeはバックグラウンドセッションとマルチエージェント管理で差別化している。

どちらが「正解」かはまだわからない。ただ確実に言えるのは、AIコーディングの評価軸が「1回のコード生成の品質」から「どれだけ長時間、どれだけ自律的に動けるか」に移りつつあるということだ。

関連記事