月額500ドルが20ドルに。Devin 2.0の値下げが意味すること

月額500ドルが20ドルになった。96%の値下げ。Cognition AIが2025年4月にDevin 2.0をリリースしたとき、最も注目を集めたのはモデルの性能向上でも新機能でもなく、この数字だった。

「世界初の自律型AIソフトウェアエンジニア」として2024年3月に華々しくデビューしたDevinは、月額500ドルという強気な価格設定で物議を醸した。早期アクセスに殺到した開発者の多くが、数ヶ月後には静かに解約していた。完全自律のAIエンジニアという触れ込みに対して、実際にできることが見合わなかったからだ。

あれから約1年。大幅な値下げとともに登場したDevin 2.0は、Cognitionが市場から受け取ったフィードバックをどう消化したかを如実に物語っている。

「安くなった」の裏にある構造変化

ただし「500ドルが20ドルになった」という見出しだけを鵜呑みにすると、実態を見誤る。

Devin 2.0の料金体系はACU（Agent Compute Unit）という従量課金制に移行している。Coreプラン月額20ドルには9ACUが含まれ、追加は1ACUあたり2.25ドル。1ACUはおよそ15分のDevin稼働時間に相当する。つまり、20ドルで得られるのは約2時間15分の作業量だ。

チーム向けのTeamsプランは月額500ドルで250ACU付き（1ACUあたり2ドル）。旧プランと同じ500ドルだが、こちらは約62時間分の稼働時間が含まれる計算になる。Enterpriseプランはカスタム価格で、VPCデプロイやSAML SSOに対応する。

要するに、Cognitionは「月額固定で使い放題」から「従量課金で裾野を広げる」へとビジネスモデルを転換した。500ドル払って使い倒す一部のヘビーユーザーではなく、20ドルから試せる多数のライトユーザーを取り込む戦略だ。SaaS業界ではよくあるピボットだが、AIエージェント市場でここまで劇的な価格改定を行ったのはDevinが初めてだろう。

問題は、この従量課金がユーザーにとって予測可能かどうかだ。単純なバグ修正で2〜3ACU（4.50〜6.75ドル）、50ファイルにまたがる大規模マイグレーションで30ACU以上（67.50ドル超）。タスクの複雑さによって消費量が大きく振れるため、月末の請求額を事前に見積もるのが難しい。数十タスクをこなして初めて自分のチームの消費パターンが見えてくる、というのが正直なところだ。

性能 — 何ができて、何ができないか

Devin 2.0の性能をCognition自身は「前バージョン比で83%多くのジュニアレベル開発タスクをACUあたり完了」と表現している。問題解決速度は4倍、リソース効率は2倍。PRのマージ率も34%から67%に改善したという。

Goldman Sachs、Santander、Nubankといった金融機関を含む数千社が導入し、18ヶ月で数十万件のPRをマージした実績がある。ある大規模組織ではセキュリティ修正にDevinを活用し、開発者の総作業時間を5〜10%削減。脆弱性修正にかかる時間は、人間の平均30分に対してDevinは1.5分と報告されている。

こうした数字は印象的だが、筆者が注目するのはCognition自身が公開した「2025年パフォーマンスレビュー」の中の率直な記述だ。曰く、Devinは「コードベースの理解はシニアレベルだが、実行はジュニアレベル」。明確な要件と検証可能なゴールがあるタスク — ジュニアエンジニアが4〜8時間かけるような作業 — には強い。一方で、曖昧な要件への対応は苦手だ。

「アプリを速くして」「ユーザー体験を改善して」といった抽象的な指示では、凡庸な結果しか返ってこない。具体的なコンポーネント構造、カラーコード、スペーシング値まで指定しないとUIの実装品質は上がらない。予期しないエラーに遭遇すると、一歩引いてアプローチを見直す代わりに、複雑な修正を重ねて問題を深刻化させるラビットホールに陥ることもある。

Answer.AIの独立テストでは、本番環境でのタスク成功率は20タスク中3タスク（15%）にとどまった。Cognitionの内部ベンチマークとの乖離は大きく、「ベンチマーク上のスコアと実運用の信頼性は別物」というAIエージェント全般に共通する課題がここにも表れている。

Devin 2.0で変わったこと

性能の数字だけでなく、Devin 2.0ではプロダクトの思想そのものが変わった。初代Devinは「人間の代わりに自律的にコードを書くAI」として売り出されたが、2.0では「人間の開発者と協働するAI」へとポジショニングを修正している。

具体的な機能としては、まずインタラクティブプランニングがある。セッション開始時にDevinが関連ファイルを調査し、予備的な計画を提示する。開発者はその計画を修正し、Devinの理解が自分の意図と合っているか確認してから自律実行に移れる。「全部任せる」から「計画を合意してから任せる」への変化は、実用上は大きな改善だ。

Devin Searchは、コードベースに対して自然言語で質問できるエージェンティックな検索機能。Devin Wikiは数時間おきにリポジトリを自動インデックスし、アーキテクチャ図やソースへのリンク付きドキュメントを生成する。新しいコードベースに参加したばかりの開発者にとっては、オンボーディングの時間短縮に直結する機能だろう。

並列実行にも対応した。複数のDevinを同時に起動し、それぞれ独立したタスクを並行処理させられる。SASからPySparkへの変換、COBOLの移行、AngularからReactへのマイグレーションなど、同じパターンの作業を多数のリポジトリに適用する場面で、Devinの艦隊を一斉展開できる。大規模マイグレーション案件では最も投資対効果が高い使い方だと思う。

SlackやJira、Linearとの統合も実装されており、既存の開発ワークフローに組み込みやすい設計になっている。

ACU課金制の功罪

Devinの料金モデルについて、もう少し掘り下げたい。ACU課金は合理的な仕組みに見えるが、いくつかの構造的な問題を抱えている。

まず透明性の課題。ACUは「仮想マシン時間、モデル推論、ネットワーク帯域幅」を正規化した単位とされているが、個々のタスクでどの要素がどれだけ消費されたかの内訳は見えにくい。開発者は結果としてのACU消費量を事後的に確認するしかなく、コスト最適化の手がかりが乏しい。

次にスケーリングの壁。Coreプランの9ACUは、週に2〜3の小さなタスクをこなせば使い切る程度の量だ。本格的に業務で使おうとすれば、追加購入が前提になる。月額20ドルという見出し価格は、あくまで「お試し」の入口に過ぎない。実際に業務レベルで運用すれば、月額数百ドルに達するのは珍しくないだろう。

ただし、この課金モデルにはポジティブな側面もある。タスク単位でコストが可視化されるため、「このタスクをDevinに任せる価値があるか」という判断を都度行える。1ACUあたり約15分で2.25ドル、時給換算で約9ドル。ジュニアエンジニアの人件費と比較すれば、明確なタスクに限定して使う分にはコスト効率は悪くない。

Trustpilotでの評価は2026年3月時点で3.0/5。ネガティブレビューの共通テーマは、タスク失敗時の説明不足、20ドルプランでのコンピュート制限、期待よりも遅い出力速度だ。

競合環境 — Devinの立ち位置

2026年4月時点で、AIコーディングエージェント市場は急速に競争が激化している。

Cursor 3はエージェント・オーケストレーション環境へと進化し、複数エージェントの並列管理やDesign Modeを武器にしている。GitHub Copilot Workspaceはコードベースとの統合の深さで差別化を図る。WindsurfやAugment Codeも同じ領域を狙う。

Devinの独自性は「完全自律型」という立ち位置にある。Cursorがあくまでエディタの中でエージェントを動かすのに対し、Devinは独立したクラウド環境でコードを書き、テストし、PRを作成するところまでを一気通貫で行う。この自律性の高さは、明確なタスクを大量にさばく用途では強みになる。反面、開発者の手元で微調整しながら進めたい作業には向かない。

筆者の見立てでは、DevinとCursorは直接的な競合というよりも、異なるワークフローに最適化された別カテゴリのツールだ。Cursorは「開発者の隣で一緒に書く」ツール、Devinは「明確な仕事を渡して結果を受け取る」ツール。どちらか一方ではなく、タスクの性質によって使い分けるのが現実的だろう。

筆者の所感

Devin 2.0の値下げは、単なるマーケティング施策ではない。Cognitionが初代Devinで学んだ教訓 — 「完全自律のAIエンジニア」という夢と現実のギャップ — を正直に反映した戦略転換だと筆者は見ている。

500ドルで売るには、ユーザーの期待値が「シニアエンジニアの代替」になってしまう。20ドルなら「ちょっと優秀なジュニアの手を借りる」という期待値に落ち着く。そしてDevinの現在の実力は、後者の期待値にはかなり応えられる水準にある。

マイグレーション、定型的なバグ修正、セキュリティパッチの適用、ボイラープレートの生成。こうした「明確で、繰り返しがあり、検証可能な」タスクにおいて、Devinは人間の開発者の時間を確実に節約する。特に並列実行との組み合わせで、数十リポジトリに同じ変更を一斉適用するような場面での生産性向上は圧倒的だ。

一方で、Devinに過度な期待を寄せるのは危険だ。曖昧な要件、複雑なアーキテクチャ判断、チーム間のコミュニケーションが必要な作業。こうした「人間的な判断」が求められる領域では、Devinはまだ頼れる存在ではない。ラビットホール問題 — エラーに遭遇したときに泥沼にはまっていく挙動 — も、実運用では無視できないリスクだ。

結局のところ、Devin 2.0が問いかけているのは「AIエージェントにどこまで任せるか」という、すべての開発チームが向き合うべき問いだ。月額20ドルで試せるようになった今、その答えを自分の手で確かめるハードルは限りなく低くなった。ただし、ACUの消費量には注意を払ってほしい。お試しのつもりが、気づけば想定外の請求になっていた、という報告は少なくない。