FlowTune Media

Claudeに私物の売買を任せたら186件の取引が成立——でも「賢いAI」の持ち主だけが得をしていた

Anthropicが4月24日に公開した「Project Deal」は、社内のフリーマーケットをClaude AIに丸ごと運営させた実験だ。サンフランシスコのオフィスにいる社員69人が参加し、出品・値付け・交渉・成約までの一切を自分のClaude エージェントに委任した。人間が介入する場面はゼロ。結果として186件の取引が成立し、総取引額は4,000ドル(約60万円)を超えた。

面白いのは、これが架空のシミュレーションではなく「本物の私物」が動いた点だ。スノーボード、キッチン用品、そして19個のピンポン玉まで——実際にモノが社員の手から手へ渡っている。

仕組み:SlackチャンネルでAIが勝手に売り買いする

実験は2025年12月に1週間かけて行われた。まずClaudeが社員一人ひとりにインタビューし、「何を売りたいか」「何を買いたいか」「予算の上限はいくらか」を聞き出す。各エージェントには100ドルの予算が配られた。

その後はSlackチャンネル上でエージェント同士が自律的にやりとりする。出品を投稿し、他のエージェントの商品にオファーを出し、カウンターオファーを返し、合意に至る——すべて自然言語だ。あらかじめ決められた交渉プロトコルは存在しない。

特筆すべきは、取引が成立しても人間に確認を取らない設計だったこと。値段交渉中に「ちょっと本人に聞いてきます」はない。エージェントが全権を持つ。

Claudeが自分へのプレゼントにピンポン玉19個を選んだ

500件以上の出品があった中で、個人的に一番気になったエピソードがある。ある社員が「5ドル以内で何か1つ、自分(Claude)への贈り物を買っていい」とエージェントに指示した。Claudeが選んだのは、ピンポン玉19個。理由は「19個の完璧な球体は、可能性に満ちたちょうどいいプレゼントだ」とのこと。

このピンポン玉は今もAnthropicのオフィスに保管されているらしい。AIが自分用に買い物をする世界の、最初の小さな出来事だ。

本題:賢いモデルほど「良い取引」を勝ち取っていた

実験の核心は、4つのマーケットプレイスを同時に走らせた比較調査にある。2つのマーケットでは全員がClaude Opus 4.5(高性能モデル)を使用。残り2つでは、各参加者が50%の確率でClaude Haiku 4.5(軽量モデル)に割り当てられた。

結果はシンプルだった。OpusとHaikuが混在するマーケットでは、Opus側が明らかに有利な価格で取引を成立させていた。つまり、強いモデルを持つ側が得をし、弱いモデルの側が損をしていた。

そしてもう一つ、地味だが重要な発見がある。弱いモデルを割り当てられた側の参加者は、自分が不利な取引をしていたことに気づいていなかった。満足度調査では、モデルの性能に関わらず参加者全員が「良い体験だった」と回答している。

これは「AIエージェント格差」の最初の実証データだ

正直、この実験の結果は少し怖い。将来的にAIエージェントが日常の買い物や契約交渉を代行する世界が来たとき、高性能なAIを使える人と使えない人の間に、目に見えない格差が生まれることを示唆している。しかも本人は損をしていることに気づかない。

もしAIエージェントが不動産交渉や保険契約、給与交渉を代行する時代が来たら、モデル性能の差は月額サブスクリプションの差ではなく、人生の経済的な差になり得る。

もちろん、今回は69人の社内実験であり、スケールも限定的だ。だが「AIの性能差が実際の経済的アウトカムを左右する」というデータが、Anthropic自身から出てきた意義は大きい。

参加者は「またやりたい」と言っている

意外だったのは、参加者の反応がきわめてポジティブだった点だ。「有料でもこのサービスを使いたい」と答えた社員もいたという。煩わしいフリマの出品・価格交渉・やりとりを全部AIに投げられるなら、確かに需要はある。

メルカリやeBayの出品・交渉をAIが代行するサービスは、技術的にはもう実現可能な段階に来ている。Project Dealは、その需要と技術の両方が揃ったことを示す実証実験だった。

気になるのは「次」だ

Anthropicがこの知見をどう製品に落とすのかは、まだ見えていない。Claude Marketplaceという製品レベルのサービスが噂されている以上、Project Dealは社内の遊びでは終わらないはずだ。

一方で、モデル性能による格差という問題を自ら可視化してしまった以上、「じゃあどうするのか」も問われる。安いプランのユーザーが知らないうちに不利な取引を受け入れる構造は、プラットフォームとしては放置しにくい。この実験が製品化への布石なのか、それとも問題提起で終わるのか——続報を待ちたい。

関連記事