FlowTune Media

月額20ドルのエージェントIDEが3つ並んだ — Cursor 3・Windsurf 2・Devin 2、何が違うのか

2026年4月2日にCursor 3.0、4月15日にWindsurf 2.0。そしてDevinは2025年末にWindsurfの親会社Cognitionに買収されながら、Devin 2.0として独立したプロダクトを維持している。

Cursor 3 vs Windsurf 2 vs Devin 2

3つのAIコーディングIDEが、ほぼ同じタイミングで「マルチエージェント」「月額20ドル」「独自モデル」という3つのキーワードに収束した。料金もコンセプトもここまで重なると、逆に「じゃあ何が違うのか」が見えにくくなる。

この記事では、個々のツールの機能紹介は既存記事(Cursor 3の全貌Windsurf 2.0の戦略Devin 2.0の値下げの意味)に譲り、三者を横に並べたときに浮かぶ設計思想の違いと「自分ならどれを選ぶか」の判断軸に絞る。

3つの「賭け」は全く違う

料金もUIも似てきたが、設計思想は三者三様だ。

Cursor 3 — 「手元で全部やる」

Cursorの賭けは、エディタの中にすべてを閉じ込めることだ。Agents Windowで最大8つのエージェントをタイル表示し、Design Modeでブラウザ上のUI要素を直接選んでチャットに投げ込む。/worktreeでgitブランチを分離し、/best-of-nで同じタスクを複数モデルに同時に投げて結果を比較する。すべてローカルのVS Code fork上で起きる。

Automationsという例外はある。Slack通知やGitHubイベントに反応してクラウドサンドボックスでエージェントを走らせる機能だ。しかしこれもCursorのUI内で結果を受け取る設計になっている。「手元が司令塔」という一貫した思想は崩していない。

Windsurf 2 — 「ローカルとクラウドを繋ぐ」

WindsurfはCursorと真逆の賭けに出た。ローカルのCascadeエージェントで計画を立て、ワンクリックでクラウドのDevinに引き継ぐ。Devinは専用VM上でブラウザ操作やE2Eテストまでこなし、結果はAgent Command Center(Kanban形式のダッシュボード)に戻ってくる。ラップトップを閉じても作業が続く。

Cognitionによる買収で手に入れたDevinの「クラウド上で何でもやれる」能力と、旧Codeium時代に築いた「40以上のIDEに対応するローカルプラグイン」の両方を活かす戦略だ。JetBrains、Vim、Emacsユーザーを取り込めるのはWindsurfだけで、ここは地味だが決定的な差になる。

Devin 2 — 「人間のIDEを捨てる」

DevinはIDEそのものを再定義した。VS Code forkではなく、ブラウザベースの独自環境。複数のDevinインスタンスを並列起動し、それぞれが専用VMの中でgitブランチ、開発サーバー、テストDB、シェルを持つ。PRを作ったあと「デスクトップでテストして」と言えば、Devinがアプリを起動し、画面を操作し、録画を返してくる。

Windsurf内にもDevinは統合されているが、スタンドアロンのDevin 2.0は「エンジニアがIDEを開かずにタスクを投げる」という使い方に最適化されている。人間はレビューだけする。ここが他の2つとの根本的な違いだ。

独自モデル対決:Composer 2 vs SWE-1.5

3ツールともサードパーティモデル(Claude、GPT、Gemini)を使えるが、勝負の分かれ目は独自モデルだ。

Composer 2(Cursor) SWE-1.5(Windsurf/Devin)
速度 200トークン/秒 950トークン/秒
インフラ 自社GPUカーネル Cerebras WSE
SWE-bench Multilingual 73.7 非公開
SWE-Bench Pro 非公開 40.08%(731タスク)
Terminal-Bench 2.0 61.7 非公開
ユーザーコスト クレジットプール消費 現在無料(プロモ期間)

数字だけ見るとSWE-1.5の速度(Composer 2の4.75倍)が目を引くが、ベンチマークの土俵が違うため精度の直接比較はできない。Cognitionは「標準SWE-Benchは実務を反映しない」として独自のSWE-Bench Proに移行しており、Cursorも自社ベンチマーク(CursorBench)を重視している。

正直なところ、どちらが「上」かは断定できない。体感で言えば、Composer 2は中規模のリファクタリングで安定して正しいコードを出す印象があり、SWE-1.5は速度の暴力でトライ&エラーを高速に回す使い方に向く。SWE-1.5が無料(プロモ期間中)なのは試す価値がある。

料金を並べてみる

エントリー価格は全員月額20ドル。しかし「20ドルで何ができるか」が違う。

Cursor Pro Windsurf Pro Devin Core
月額 $20 $20 $20 + $2.25/ACU
課金体系 クレジットプール デイリー/ウィークリー・クォータ 基本料+従量
タブ補完 制限付き含む 無制限・無料 N/A
エージェント ローカルのみ ローカル+クラウドDevin クラウドのみ
上位プラン Ultra $200/mo Max $200/mo Team $500/mo
チーム $40/user/mo $40/user/mo $500/mo(250ACU)

CursorとWindsurfの$20プランは「使い放題風」だが実態は上限がある。Cursorはクレジットプール($20分のクレジットで、モデルごとに消費速度が異なる)、Windsurfはデイリー/ウィークリー・クォータ(トークン予算が自動リセット)。タブ補完がWindsurfだけ無料なのは見逃しやすいが、日常の体験には効く。

Devinの課金は異質だ。月額20ドルは入場料で、実際の作業にはACU(Agent Compute Unit)が別途かかる。1ACUは約15分の稼働で$2.25。1時間で約$9。月に20時間Devinを走らせれば追加で$180かかる計算になる。安く見えて実は最も高くなり得る構造だ。

何で選ぶか

比較表をいくら並べても最後は「自分の仕事に合うか」で決まる。以下は筆者の判断基準だ。

Cursor 3を選ぶ場面

  • VS Codeに慣れていて離れたくない
  • 複数モデルを切り替えて使いたい(Composer 2だけでなくClaude、GPTも)
  • /best-of-nのようにモデル同士を競わせる使い方に興味がある
  • プラグインエコシステム(Atlassian、Datadog等30以上)を活用したい
  • Ghost Modeのようなプライバシー機能が必要

Windsurf 2を選ぶ場面

  • JetBrains(IntelliJ、PyCharm、GoLand等)やVim/Neovimを使っている
  • ローカルで計画 → クラウドで実行の流れが欲しい
  • エンタープライズコンプライアンス(HIPAA、FedRAMP)が要件
  • SWE-1.5の速度を試したい(現在無料)
  • 1つのツールでCascade(ローカル)とDevin(クラウド)の両方を使いたい

Devin 2を選ぶ場面

  • 自分でコードを書くよりレビューする時間のほうが長い
  • PRを投げて寝ている間にE2Eテストまで終わっていてほしい
  • IDEへのこだわりがない(ブラウザベースで十分)
  • 「1タスク=1VM」の完全隔離がセキュリティ的に嬉しい
  • リポジトリの自動ドキュメント生成(Devin Wiki)が欲しい

気になる点

Cursor — VS Code forkへのロックインは年々強まっている。JetBrainsユーザーは実質的に選択肢から外れる。また、クレジットプールの消費速度がモデルごとに異なるため、月末に「思ったより残高がない」という状況が起きやすい。

Windsurf — 2026年3月の料金改定($15→$20)とクォータ制への移行で一部ユーザーの不満が噴出した。Devin統合は魅力的だが、CascadeとDevinで操作体系が異なるため、慣れるまで行き来に戸惑う場面がある。

Devin — ACU課金は使い方次第で青天井になる。従量部分を含めた月額を管理する仕組みが弱い。また、クラウドVMでの作業ゆえにレイテンシがあり、ローカルIDEのサクサク感を期待すると物足りない。

3つが収束した先に何があるか

この2週間で起きたことは「AIコーディングツール市場の終わりの始まり」ではない。むしろ「棲み分けの始まり」だ。

Cursorはローカルファーストのパワーユーザー向け。Windsurfはハイブリッド戦略でエンタープライズと多IDE派を狙う。Devinは人間がエディタを開かない世界を見ている。

3つとも月額20ドル。3つともマルチエージェント。しかし賭けている未来は全く違う。迷っているなら、まずSWE-1.5が無料のうちにWindsurfを試し、ローカル完結が好みならCursorに戻り、「自分で書くより任せたい」と感じたらDevinに課金する。今なら3つとも安い入口がある。急いで1つに決める必要はない。

関連記事