CognitionがDevin向けにSWE-1.6をリリース——性能だけでなく「使い心地」を本気で鍛えたモデル
AIコーディングツールの競争軸が変わりつつある。かつて「どれだけ高いベンチマークスコアを出せるか」だけが差別化の尺度だったが、2026年に入ってから「実際に使っていて快適かどうか」という体験面の品質が問われるようになってきた。Cognitionが4月7日にリリースしたSWE-1.6は、その流れを象徴するモデルだ。
SWE-1.6とは何か
SWE-1.6は、CognitionがDevinおよびWindsurf向けに開発したソフトウェアエンジニアリング特化モデルの最新版だ。前バージョンであるSWE-1.5の後継として位置づけられ、同社が3月に公開した「SWE-1.6 Preview」をさらに磨き上げたものになる。
注目すべきは、Cognitionがこのリリースで強調しているのが「より高いスコア」ではなく「model UX(モデルのユーザー体験)の劇的な改善」だという点だ。
SWE-Bench Proにおける性能はPreviewモデルと同水準を維持しつつ、振る舞いの複数の軸で大幅な改善を達成した。前モデルで見られた問題——単純なタスクに対する過度な推論、必要以上のターン数、ツールより端末コマンドへの依存、シーケンシャルなツール呼び出し——がSWE-1.6では解消されている。
具体的に何が変わったのか
技術的な改善の核心は、トレーニングへの長さペナルティ(length penalty)の導入にある。不必要に長い処理経路を抑制することで、ループ的な思考が減少し、副次的に並列ツール呼び出しへの傾向が強まった。
実際の挙動の変化としては以下が挙げられる。
- 並列ツール呼び出しの増加:複数の情報を同時に取得し、コンテキスト収集が格段に速くなった
- ループの減少:同じ処理を繰り返す「ラビットホール」的な挙動が大幅に抑制された
- ツール優先のアプローチ:シェルコマンドへの依存を減らし、専用ツールを積極的に活用するようになった
結果として、同じタスク解決率を維持しながらアシスタントのターン数が横ばいに抑えられ、モデルがより少ないユーザー入力で文脈を把握できるようになっている。
提供形態と速度
SWE-1.6はWindsurf上で即日利用可能で、今後3ヶ月間は2つのモードが提供される。
- 無料ティア(Fireworks提供):200 tok/s
- 高速ティア(Cerebras提供):950 tok/s(有料ユーザー向け)
950 tok/sという速度は、主要な競合モデルと比較しても際立って高い。SWE-1.5と同様に、Cerebrasのウェーハスケールチップを活用した推論速度の維持がCognitionのモデル戦略の柱となっている。
Windsurf買収との文脈
SWE-1.6が「Windsurf上で提供」される背景には、CognitionによるWindsurf買収がある。Cognitionは2025年にWindsurf(旧Codeium)の残存チームと技術を買収し、DevinのエージェントモデルとWindsurf IDEを統合するかたちでAIコーディング市場に本格参入した。
SWE-1.6はその統合の成果の一つとも言える。DevinのバックエンドモデルがWindsurfのIDEを通じて開発者に届くエコシステムが整いつつある。
Devin自体は現在もTeamsプランで月額500ドルで提供されており、大規模チームやエンタープライズ向けの自律型エンジニアとしての立ち位置は変わっていない。
筆者の見方
SWE-1.6のリリースで筆者が評価するのは、Cognitionが「ベンチマークの数字」だけでなく「モデルの振る舞いの質」を正面から取り組んだ姿勢だ。
AIエージェントの実用上の問題は、多くの場合スコアの低さではなく「ループして止まらない」「関係ないことをやり始める」「ターン数が無駄に多い」といった挙動の問題だ。これらはベンチマークには反映されにくいが、実際の開発フローでは致命的にストレスになる。length penaltyによるトレーニング改善でこれを抑制したアプローチは、他のモデル開発にも示唆がある。
ただし一点留保がある。SWE-1.6はWindsurf経由での提供が中心であり、Devinエージェントとして直接利用する場合の体験がどう変わるかについては、Cognitionの公式発表での言及が限定的だ。DevinのTeamsプランで実際に業務利用しているチームにとって、SWE-1.6の恩恵がどの程度リアルタイムに反映されるかは引き続き確認が必要だろう。
AIコーディングエージェントの次のフロンティアは、「賢さ」ではなく「信頼できる振る舞い」にある——SWE-1.6はその方向への一歩として注目に値する。
参考リンク
関連記事
月額500ドルが20ドルに。Devin 2.0の値下げが意味すること
月額500ドルが20ドルになった。96%の値下げ。Cognition AIが2025年4月にDevin 2.0をリリースしたとき、最も注目を集めたのはモデルの性能向上でも新機能でもなく、この数字だった。 「世界初の自律型AIソフトウェアエンジニア」として2024年3月に華々しくデビューしたDevinは、月額500ド
FigmaがMCPで「デザインとコードの壁」を壊しにきた — 双方向ワークフローの本気度
デザイナーとエンジニアの間には、長年にわたって埋まらない溝があった。 Figmaでデザインが仕上がる。エンジニアがそれを受け取ってコードに落とす。出来上がったUIをデザイナーが見る。「余白が違う」「フォントウェイトが微妙に違う」「ホバー状態を実装し忘れている」。Figmaに戻り、コメントを残し、またエンジニアに差し
GitHub Copilot CLIがBYOK対応 — 自前のAPIキーとローカルモデルで、Copilotの課金から降りられる
「Copilotを使いたいが、GitHubにコードを送り続けるのが嫌だ」——そういう開発者は、思っているより多い。 4月7日、GitHubがCopilot CLI(https://github.com/github/copilot-cli)にBYOK(Bring Your Own Key)とローカルモデル接続をサポ