FlowTune Media

1つのDevinが10のDevinを動かす — 並列エージェント「Managed Devins」の仕組みと代償

大きなリファクタリングを1つのAIエージェントに任せると、だいたい途中で精度が落ちる。コンテキストが膨らみ、最初に決めた方針を忘れ、同じファイルを2回書き換えてテストが壊れる。AIコーディングを日常的に使っている人なら、一度は経験しているはずだ。

Devin

Cognitionが3月19日にリリースしたManaged Devinsは、この問題に正面から取り組んだ機能になる。大きなタスクを受け取ったDevinが自分で作業を分割し、最大10体の「子Devin」を起動して並列に処理させる。

親Devinは「手を動かさない上司」になる

仕組みはシンプルだ。メインのDevinセッション(親Devin)がタスクの全体像を把握し、適切な粒度に分解する。たとえば「このリポジトリのPython 2コードをPython 3に移行して」という依頼なら、モジュールごとに切り分けて、それぞれを個別のDevinに割り当てる。

各子Devinは独立したVM上で動く。自分専用のターミナル、ブラウザ、開発環境を持ち、シェルコマンドの実行もテストの実行も自己完結する。親Devinのコンテキストに子Devinの作業ログが蓄積されないから、前述の「コンテキスト肥大化→精度低下」問題を構造的に回避できる。

親Devinの役割は3つ。進捗の監視、コンフリクトが起きた場合の調整、そして各子Devinの成果物の統合だ。子Devinの作業軌跡を読んで「何がうまくいき、何がハマったか」を学習し、次のタスク分割に反映する仕組みもある。

Cursor 3やClaude Codeとは何が違うのか

「並列エージェント」は2026年のAIコーディング界隈で最も過熱しているテーマだ。Cursor 3のAgents Windowは複数のエージェントをタブで並べて手動管理する設計。Claude CodeのRoutinesは定義済みワークフローの自動実行に寄せている。

Managed Devinsの特徴は「AIがAIを管理する」という設計判断にある。ユーザーが分割方針を決めるのではなく、親Devinが自律的に判断する。人間は最初の指示と最終的な承認だけでいい。

この自律性は両刃の剣でもある。分割の妥当性がブラックボックスになりやすい。「なぜこの粒度で分けたのか」が見えにくいと、結果が期待どおりでなかったときのデバッグが難しくなる。Cursor 3のように人間が分割をコントロールするほうが、現時点では安心感があるという声も理解できる。

料金は「10倍働くから10倍かかる」のか

ここは気になるところだ。DevinはACU(Agent Compute Unit)による従量課金で、1ACUがおよそ15分のDevin稼働に相当する。子Devinを10体走らせれば、単純計算で10倍のACUを消費する。

ただし実際には、10体が並列に15分で終わるタスクを1体で直列に処理すれば150分かかる。総コストが同じでも所要時間は10分の1になる。「時間を金で買う」判断がしやすい場面——たとえばリリース前の緊急修正——では十分にペイするだろう。

Devinの現行料金はPro $20/月(基本枠付き)からで、超過分はドル建ての従量課金になる。Teamsプランは$500/月で250ACU(約62.5時間分)が含まれる。Managed Devinsを積極的に使うなら、Teamsプランのほうが結果的に安くつく可能性が高い。

正直な評価

コンセプトは理にかなっている。コンテキスト肥大化の問題をVM分離で解決するアプローチは技術的にきれいだし、実際に「100ファイルのマイグレーションを10並列で1時間」のようなユースケースでは圧倒的に速いだろう。

一方で、子Devin間の依存関係が複雑なタスク——たとえば共有ステートを持つモジュールのリファクタリング——では、親Devinの調整能力がボトルネックになる。ここが崩れると、10体分のACUを消費した挙げ句に手作業でマージするという最悪のシナリオもありえる。

結局のところ、Managed Devinsが効くのは「独立性の高いサブタスクに分解できる大規模作業」だ。マイグレーション、テスト追加、コードスタイル統一、ドキュメント生成あたりが最適解。設計判断が絡む複雑なリファクタリングは、まだ人間が分割したほうがいい。

Devin can now Manage Devins — Cognition AI

関連記事