Claude Fable 5が戻ってきた。ただしデバッグ性能は70%落ちている — 「弱体化していない」の本当の意味

デバッグスコア86.2が、25.9に落ちた。

独立テスト機関BridgeMindが7月2日に公開した検証結果だ。TypeScriptのデバッグタスク12件中、実際にFable 5が処理したのはわずか3件。残り9件は安全分類器に引っかかり、Opus 4.8にリルートされていた。

7月1日、Anthropicは19日間の停止を経てClaude Fable 5をグローバルに再デプロイした。モデルの重みは一切変更されていない。Anthropicは「弱体化していない」と明言している。

技術的にはその通りだ。だがユーザーの手元に届くものは、6月に使えたFable 5とは構造的に違う。

19日間に何が起きたか

経緯を前回の記事で詳しく扱ったが、要点だけ整理する。

6月12日、米国商務省がFable 5とMythos 5に対して輸出管理指令を発出。きっかけはAmazonの研究者が「fix this code」という単純なプロンプトでFable 5に既知の脆弱性を特定させ、エクスプロイトコードを生成させたことだった。Amazon CEOのAndy Jassyがホワイトハウスにエスカレートしたと報じられている。

Anthropicは「GPT-5.5やKimi K2.7でも同じことができる」と反論したが、商務省は動かなかった。全ユーザーに対する停止が19日間続いた。

6月30日、商務長官Howard Lutnickが規制解除に署名。Anthropicが今後のセキュリティ問題の自主的な発見、将来のリリースでの事前調整、悪用報告を約束したことが条件だった。

分類器の問題 — 「弱体化」ではなく「検問」

復帰にあたってAnthropicが追加したのは、サイバーセキュリティ分類器だ。

この分類器はリクエストがFable 5に届く前に介入する。サイバーセキュリティに関連すると判断したリクエストをOpus 4.8にリルートする仕組みで、Amazonが報告した手法を99%以上ブロックするとAnthropicは説明している。

問題は偽陽性の多さだ。

BridgeMindのテストでは、普通のTypeScriptデバッグタスクの75%がこの分類器に引っかかった。リファクタリングのスコアも73.6から38.4に低下。ハルシネーション耐性すら75.9から61.7に下がっている。モデルが弱くなったのではなく、モデルに到達するリクエストが減った結果だ。

Decryptは「Fable 5はナーフされていない。ルーターが偏執的なだけだ」と表現した。正直、言い得て妙だと思う。

Anthropicは「今後数週間で偽陽性を減らす」と約束している。が、具体的なタイムラインは示されていない。

業界初の「ジェイルブレイク重大度フレームワーク」

再デプロイと同時に、Anthropicは業界を横断する新しい枠組みを提案した。Amazon、Microsoft、Googleと共同で策定したジェイルブレイク重大度フレームワークだ。

ジェイルブレイクの深刻さを4つの軸で評価する。

能力獲得 — 既存のツールでは到達できない攻撃能力をどれだけ解放するか
能力の幅 — 解放される攻撃タスクの種類がどれだけ多いか
武器化の容易さ — 実際の攻撃にどれだけ人的努力が必要か
発見容易性 — その手法がどれだけ簡単に見つかるか

8月1日までにNSA、財務省、CISAが「どのモデルが正式審査の対象になるか」の機密ベンチマークを策定する予定だ。

この枠組みは素直に評価したい。これまでジェイルブレイクの報告は「できた/できない」の二元論で語られることが多く、深刻度の共通言語がなかった。「GPT-5.5でも同じことができるのにFable 5だけ止められた」というAnthropicの不満は、まさにこの共通基準がなかったから生まれた。

料金が変わる — 7月7日以降は従量課金

もうひとつ見落とされがちな変更がある。料金体系だ。

7月1日〜7日は復帰記念として、Pro・Max・Team・Enterprise（プレミアム）のサブスクリプション利用者にFable 5が週間利用枠の50%まで追加料金なしで開放されている。

だが7月7日以降、Fable 5はサブスクリプションの標準機能から外れ、従量課金制に移行する。APIと同じ料金（入力$10/出力$50 / 百万トークン）のクレジットを購入して使う形だ。Opus 4.8の約2倍の価格になる。

Anthropicは「十分なキャパシティが確保でき次第、サブスクリプション標準に戻す」としているが、時期は未定。事実上、無制限だったFable 5の利用が有限になった。

いま何をすべきか

Fable 5をコーディングに使っていたなら、分類器のリルートが業務に影響していないか確認する必要がある。とくにセキュリティ関連のコード——認証、暗号化、入力バリデーション——を扱うリクエストは高確率でOpus 4.8に回されるだろう。

API経由で使う場合、レスポンスヘッダーやモデル情報で実際にどのモデルが応答しているか確認できる。Opus 4.8にフォールバックされているなら、プロンプトの書き方を変えて分類器を避ける工夫が必要になるかもしれない。

7月7日以降は料金も変わるため、利用量の多いユーザーはコストシミュレーションをしておくべきだ。

19日前、Fable 5は「危険すぎて止められた」モデルだった。今は「安全装置が過敏すぎて性能が出ない」モデルになっている。皮肉な話だが、Anthropicが分類器を改善するまでの辛抱だろう。モデル自体の実力は、まだそこにある。

Anthropic公式 — Redeploying Fable 5 / ジェイルブレイクフレームワーク詳細

Claude Fable 5が戻ってきた。ただしデバッグ性能は70%落ちている — 「弱体化していない」の本当の意味

19日間に何が起きたか

分類器の問題 — 「弱体化」ではなく「検問」

業界初の「ジェイルブレイク重大度フレームワーク」

料金が変わる — 7月7日以降は従量課金

いま何をすべきか

関連記事

公開3日で全世界停止 — Claude Fable 5に米国政府の輸出規制が下った経緯と、開発者がいま知るべきこと

Anthropicが謝罪した「見えない制限」 — Claude Fable 5は競合の出力を黙って劣化させていた

「AIがAIを作る日」は2年以内に来る — Anthropicが業界に突きつけた"一時停止"の提案