Kiro vs Devin Desktop — 「設計してから書く」と「丸ごと任せる」はどちらが正解か
同じ機能を実装するとき、KiroとDevin Desktopはまるで違う動きをする。
Kiroに「決済フローを追加して」と頼むと、まず要件定義書が出てくる。EARS記法で書かれた仕様、システム設計、タスクリスト。コードを1行も書かないまま10分が過ぎる。ようやくすべてが揃ったところで、仕様書に沿ってコードを生成し始める。

Devin Desktopに同じことを頼むと、Agent Command Centerにタスクカードが1枚追加される。あとはDevinが勝手にプランを立て、コードを書き、テストを通し、PRを作る。その間、開発者は別のタスクを進められる。15分後にSlackに通知が届き、「PR #247を作成しました。レビューをお願いします」と言われる。
どちらが正しいかという話ではない。これは「AIとどう働きたいか」の選択だ。
設計思想が根本から違う
Kiro(AWS)のアプローチは**仕様駆動開発(Spec-Driven Development)**と呼ばれる。プロンプトからいきなりコードを生成するのではなく、requirements.md→design.md→tasks.mdという3段階の設計文書を先に作り、それに基づいてコードを書く。
この仕様書にはEARS記法が使われている。「WHEN [条件] THE SYSTEM SHALL [期待される動作]」という構造化された書式で、曖昧な要件を具体的でテスト可能な仕様に変換する。地味だが、これがあるおかげで「何を作るか」のズレがコードを書く前に潰せる。
一方のDevin Desktop(Cognition)はエージェント委任型だ。デフォルト画面からしてKanbanボード風のAgent Command Centerで、そこから複数のタスクを並列で自律エージェントに投げる。Devinはプランニング、コーディング、テスト、PR作成まで一気通貫で実行する。6月のリブランドで内部エージェントもRust製のDevin Localに刷新され、旧Cascadeから約30%のトークン効率改善が報告されている。
端的に言えば、Kiroは「AIと一緒に設計する」ツールで、Devin Desktopは「AIに仕事を渡す」ツールだ。
料金の構造が全く違う
月額だけ見ると、どちらもProプランが$20で同じに見える。だが中身は別物だ。
| Kiro | Devin Desktop | |
|---|---|---|
| 無料プラン | あり(50クレジット/週) | なし |
| Pro月額 | $20(1,000クレジット) | $20(ACU別売) |
| 上位プラン | $40(2,000クレジット)/ $200(10,000クレジット) | $500/月(250 ACU込み) |
| 従量課金 | $0.04/クレジット(超過時) | $2.00〜2.25/ACU |
| ACU/クレジットの意味 | エージェント操作1回 ≒ 数クレジット | 約15分の自律稼働 |
Kiroは月額に含まれるクレジットで多くの作業が完結する。超過しても1クレジット約6円だから、コストの予測がしやすい。
Devin Desktopの$20は入場券にすぎない。実際のエージェント稼働にはACU(Agentic Computing Unit)が必要で、1 ACUあたり$2.00〜2.25。複雑なタスクを1日10件回すと、月額が$200〜$500に跳ね上がることもある。チームプランの$500/月には250 ACUが含まれるが、これは約62.5時間のDevin稼働に相当する。足りるかどうかはチームの使い方次第だ。
正直に言って、Devin Desktopのコスト予測は難しい。ただし、その分「人間が何もしなくてもPRが出てくる」という体験には代えがたい価値がある。
向いている場面が重ならない
両方を使い分けるとしたら、こうなる。
Kiroが強い場面:
新機能の設計から実装まで。仕様書が先に出来上がるので、チーム内レビューが楽になる。「なぜこのコードを書いたか」がrequirements.mdに残っているから、後から入ったメンバーも文脈を追える。AWS環境でCodeCatalystと連携させれば、スプリントボードのissueをそのままKiro Specに取り込める。
Agent Hooksも地味に便利だ。ファイル保存時に自動でユニットテストを生成したり、新規ファイル作成時にセキュリティスキャンを走らせたりできる。決められたルールに沿って開発を進める必要がある、エンタープライズの現場に合っている。
Devin Desktopが強い場面:
並列処理とバックグラウンド作業。テスト生成、CIの修正、ライブラリのアップグレード、レガシーコードのリファクタリング。Devinはこれらを複数同時にバックグラウンドで実行できる。Coreプランでも最大10セッションの並行稼働が可能だ。
特にレガシーコード移行は他のAI IDEにない強みだ。COBOL、Fortran、Objective-CのコードベースをRustやGoに変換できると公式は謳っている。大規模なマイグレーション案件を抱えるチームにとっては、人月を大幅に圧縮できる可能性がある。
正直に気になるところ
Kiroの懸念: 単純なタスクにオーバーヘッドが大きすぎる。ボタンの色を変えたいだけなのに要件定義書を作られると、さすがにもどかしい。Quick Planモードが6月のアップデートで追加されたが、根本的にKiroは「じっくり設計する開発」に最適化されている。バグの素早い修正やプロトタイピングには向かない。
タスクが途中で失敗したときにコンテキストが全部飛ぶという報告もある。10分かけた仕様書が無駄になるのは精神的にきつい。
Devin Desktopの懸念: コストの不透明さはすでに述べた。もうひとつ深刻なのが、自律実行の品質のばらつきだ。具体的で明確なタスクを与えれば高品質な成果物が返ってくるが、曖昧な指示だと中途半端なコードが生成される。Trustpilotでは3.0/5と、ユーザー評価は分かれている。
WindsurfからDevin Desktopへのリブランドでインターフェイスが大きく変わり、既存ユーザーからの戸惑いの声もある。エディタ主体だったWorkflowがAgent Command Center主体になったことで、「コードを自分で書きたい」タイプの開発者には居心地が悪くなった。
もし組み合わせるなら
KiroもDevin Desktopも、ACP(Agent Client Protocol)をサポートしている。つまり理論上は、Kiroで仕様書を書き、その仕様をDevin Desktopのエージェントに渡して実装させる、というワークフローが組める。
仕様書の精度が高ければ、Devinの自律実行の品質も上がる。Kiroの弱点(実装のスピード)とDevinの弱点(曖昧な指示への対応力)を相互に補える可能性がある。現時点でこの連携が簡単にできるかというとまだ手作業が多いが、ACPの普及が進めば現実的な選択肢になるだろう。
結論
| 判断基準 | Kiro | Devin Desktop |
|---|---|---|
| 予算を抑えたい | ○(無料〜$20で完結しやすい) | △($20+ACU課金) |
| 設計プロセスを重視 | ◎ | △ |
| バックグラウンドで並列実行 | △ | ◎ |
| AWS環境で開発 | ◎ | ○ |
| レガシーコード移行 | △ | ◎ |
| 一人で素早くプロトタイプ | △ | ○ |
「自分がコードの品質に責任を持ちたい」ならKiro。「エージェントに任せて自分は次のことを考えたい」ならDevin Desktop。
どちらかが正解ではなく、開発者と組織のスタイルの問題だ。ただ、コストだけで言えばKiroの方が圧倒的に始めやすい。まずKiroの無料プランで仕様駆動の感覚を試して、自律エージェントが必要な場面が出てきたらDevin Desktopを検討する、という順番が現実的だろう。
関連記事
Kiro vs Cursor 徹底比較 2026 — 仕様書を先に書くAI IDEと最速AI IDE、どっちが正解か
KiroとCursorを料金・開発手法・エージェント性能・AWS統合で比較。スペック駆動と速度重視、2つのAI IDEの選び方を解説。
Devin Desktop vs Cursor 徹底比較【2026年最新】Windsurf統合後、AI IDEの勢力図が変わった
Windsurf改めDevin DesktopとCursorを5軸で比較。Agent Command Center vs Composer 2.5、料金・設計思想の違いから最適な選び方を解説。
Windsurf、名前ごと消えた — 後継「Devin Desktop」で何が変わるのか
WindsurfがDevin Desktopに改名。SWE-1.6やACP対応など変更点と既存ユーザーへの影響を整理。