FlowTune Media

Claudeの「PC操作」スコアが15%から72%に跳ねた — 裏にいたスタートアップをAnthropicが買収

2026年2月25日、Anthropicがデスクトップ操作AIのスタートアップVercept(ヴァーセプト)の買収を発表した。

Anthropic Vercept買収

地味なニュースに見える。しかし数字を追うと話が変わる。2024年末、Claude Sonnet 3.5のOSWorld(コンピューター操作のベンチマーク)スコアは15%未満だった。2026年4月現在、Claude Sonnet 4.6は72.5%を叩き出している。1年半で5倍。この飛躍を支えた技術チームを丸ごと取り込んだのが今回の買収だ。

Verceptとは何者だったのか

Verceptは「AIにPCを操作させる」技術に特化したシアトルのスタートアップだ。2024年設立で、累計5000万ドル(約75億円)を調達。2025年1月のシードラウンド(1600万ドル、評価額6700万ドル)には元Google CEOのエリック・シュミット、Google DeepMindチーフサイエンティストのジェフ・ディーン、Cruiseの創業者らがエンジェルとして参加していた。

共同創業者5人のうち3人がAnthropicに移籍した。Kiana Ehsani(CEO、AI2でロボットの視覚認識を研究)、Luca Weihs(AI2の研究マネージャー)、Ross Girshick(Meta FAIRの元リサーチサイエンティスト、物体検出の古典手法R-CNNの共同開発者)。残りの1人Matt DeitkeはMeta AIに移籍済みで、その報酬パッケージは4年で約2.5億ドルと報じられている。

Verceptが開発していたデスクトップエージェント「Vy」は、スクリーンショットを見てマウスとキーボードを操作するcomputer use専門ツールだった。従来のRPA(UiPath等)と違い、スクリプトやAPIの設定なしに「画面を見て判断する」方式。買収発表から30日でサービスを終了し、純粋な人材・技術の吸収だったことを示している。

発表当日、RPAの代表格UiPathの株価は3.6%下落した。市場はAI駆動のcomputer useを、スクリプト型RPAへの根本的な脅威と見ている。

Bun、そしてVercept — Anthropicの買収パターン

Anthropicにとって主要な買収は2件目だ。1件目は2025年12月のBun(JavaScriptランタイム)。2件目が今回のVercept。

パターンがある。Bunの買収はClaude Codeの実行環境を強化するため(発表時、Claude Codeは年間10億ドルの売上ペースに達していた)。Verceptの買収はClaudeのcomputer use能力を強化するため。どちらも「Claudeの弱点を外部から一気に埋める」動きだ。基礎モデルは社内で作り、周辺能力はスタートアップごと買う。この使い分けが明確になってきた。

Claude Coworkとの接続

タイミングが興味深い。Vercept買収は2月25日。そして4月9日、AnthropicはClaude Coworkを全有料プランで正式公開した。Coworkはまさに「ClaudeにPCを操作させる」製品だ。

偶然ではないだろう。Verceptのチームが合流してから約6週間でCoworkがGAに至った計算になる。もちろんCowork自体はそれ以前から開発されていたが、Verceptの知見がGA判断を後押しした可能性は高い。

OSWorld 72.5%という数字は、実務で言えば「ブラウザでフォームを埋める」「ファイルをリネームして移動する」「特定のアプリで定型作業をこなす」といったタスクの7割以上を正しく完了できるレベルだ。2024年末の15%は「たまに成功する」程度だったから、実用と非実用の境界を越えた。

競合はどこにいるか

「AIにPCを操作させる」レースはAnthropicだけのものではない。

OpenAIはGPT-5.4にcomputer use機能を搭載し、Codexからデスクトップアプリを直接操作できるようになっている。PerplexityはPersonal Computer機能でMacアプリとの統合を進めている。Devinはクラウド上のVMでE2Eテストまでこなす。

ただし、Anthropicのアプローチは他と少し違う。Claude Coworkはローカルマシン上で動き、ユーザーの画面を直接見て操作する。クラウドVMではなく「目の前のPC」を対象にしている点で、エンドユーザーにとっては最も直感的だ。

正直なところ

computer useは過大評価されやすい分野でもある。ベンチマークの72.5%は印象的だが、OSWorldの残り27.5%には「複数ステップの条件分岐」「エラーからのリカバリ」「予期しないポップアップへの対応」など、実務で頻繁に遭遇するケースが含まれる。数字が90%を超えるまでは「人間が隣で見ている」前提の方が安全だ。

それでも、Verceptのチームを取り込んだことでAnthropicのcomputer use開発は加速するだろう。Ross GirshickはR-CNNの共同開発者で、コンピュータビジョンの世界では知らない人がいないレベルの研究者だ。その人がClaudeの「目」を良くする仕事に就く。次のモデルアップデートで何が起きるか、注目しておく価値はある。

関連記事