「AIがAIを作る日」は2年以内に来る — Anthropicが業界に突きつけた"一時停止"の提案
6月4日、Anthropicは「When AI builds itself」と題したレポートを公開した。共同創設者のJack Clarkと、同社リサーチ研究所長のMarina Favaroの連名だ。
内容は率直だった。「AIが自分自身の後継モデルを設計・開発できるようになる日は、多くの組織が備えているよりも早く来るかもしれない」。
Claudeが書いたコードは80%を超えた
レポートの中で最も目を引くのは、Anthropic自身の開発現場から出た数字だ。
2025年2月にClaude Codeのプレビューを開始した時点で、Claudeが書いてマージされるコードの割合は「一桁台」だった。それが2026年5月時点で80%を超えている。エンジニア1人あたりの四半期コード出荷量は、2021年〜2025年と比較して約8倍に増えた。
数字はコード量だけにとどまらない。曖昧な指示や事前に正解が定義されていないオープンエンドな問題への成功率は、2025年9月の25%から2026年5月に76%へ跳ね上がった。たった8か月で50ポイント以上の改善だ。
さらに注目すべきは、Mythos Preview(Anthropicの最新内部モデル)がML最適化タスクで達成した52倍の高速化だ。人間の研究者が4〜8時間かけて4倍の速度改善を出すところを、Claudeはそれを大幅に上回った。社内130人への調査では、Mythos Preview使用時の生産性は中央値で約4倍と報告されている。
「再帰的自己改善」とは何か
Anthropicがこのレポートで繰り返し使うのが「再帰的自己改善(recursive self-improvement)」という用語だ。
定義はシンプルだ。AIシステムが自律的に、自分自身の後継となるAIを設計・開発できる状態を指す。人間がステップごとに指示を出すのではなく、AIが自らの判断でアーキテクチャの改良、学習データの選定、ハイパーパラメータの最適化を回し続ける。開発サイクルが年単位から日単位、あるいは時間単位に圧縮される可能性がある。
レポートによると、AIが自律的に遂行できるタスクの持続時間は、おおよそ4か月ごとに倍増している。以前の7か月ごとの倍増から加速した。Jack Clarkはこの傾向から、**2028年末までに再帰的自己改善が実現する確率を60%**と見積もっている。
ただしAnthropicは「まだそこには到達していない」と明言しており、実現が不可避だとも言っていない。あくまで「多くの組織が準備できているよりも早い可能性がある」という警告だ。
提案: 業界で協調して「一時停止」できる仕組みを
レポートの核心は警告ではなく、提案にある。
Anthropicは、最先端のAI開発企業が協調して開発を一時停止(pause)できるメカニズムの構築を呼びかけた。ポイントは「一方的な停止」ではなく「検証可能な協調停止」だ。自社が止めたとしても、他社が止めなければ競争に負けるだけだから意味がない。互いが本当に停止しているかを検証できる仕組みが必要だ、という論理だ。
Jack Clarkはこれを冷戦期の核軍縮交渉になぞらえた。ただし自らその限界も認めている。ミサイルサイロは衛星で監視できるが、AIの学習ランは隠すのがはるかに容易だ。
OpenAIの反論: 「決めるのは企業ではなく政府」
この提案に対し、OpenAIは即座に反論した。
「AI開発のペースに関する決定は、一つの研究所や企業、利害関係者グループに委ねるべきではない。民主的な政府が — 企業単独ではなく — ルール、安全策、説明責任の仕組みを最終的に決めるべきだ」
正論ではある。だが、各国政府がAI開発の実態に追いつけていない現状を考えると、「政府が決めるべき」は事実上「誰も止められない」と同義かもしれない。
IPO直前の安全宣言は"ポジショントーク"か
このレポートの発表が6月4日だったことを、素通りするわけにはいかない。
Anthropicは5月28日に$965B(約140兆円)の評価額で$65Bの資金調達を完了し、6月1日にIPOの登録届出書(S-1)をSECに提出した。つまりレポートの発表はIPO申請のわずか3日後だ。
安全性への真摯な姿勢を示すのか。それとも「安全なAI企業」というブランドで上場バリュエーションを守りに行っているのか。この問いに正解はないが、タイミングが偶然だと考える人は少ないだろう。
とはいえ、レポートが提示した数字自体は動かない。80%のコード、8倍の生産性、4か月ごとの倍増。これらが嘘でない限り、タイミングの問題は二次的だ。
Claude Codeユーザーが感じていること
筆者はClaude Codeを日常的に使っている立場だが、Anthropicが「80%のコード」と言ったとき、正直なところ驚きは少なかった。プロンプトを工夫すれば、小さなプロジェクトのほとんどのコードをClaude Codeに任せられることは実感として知っている。
だがそこには微妙な感覚もある。Claudeが生成したコードの品質は確かに上がっているが、「このコードが何をしているか」を本当に理解して承認しているかと問われれば、自信を持ってイエスとは言いづらい。レビューのボトルネックは人間の認知能力にある。AIがコードを書く速度が上がるほど、この溝は広がる。
Anthropicのレポートが突きつけているのは、まさにこの構造だ。AIの能力が上がるほど、人間がそれを監視する能力が相対的に下がっていく。
2028年末までに何が起きるか
再帰的自己改善が本当に実現するかどうかは、正直わからない。ただしAnthropicが公開したトレンドライン — タスク自律遂行時間の4か月倍増、ML最適化タスクの52倍高速化 — を直線的に延長すれば、2028年末という見立てに「ありえない」とは言いにくい。
もしこれが実現した場合、影響はAI業界だけにとどまらない。ソフトウェア開発のコスト構造が根底から変わり、企業がエンジニアに求めるスキルセットも変わる。コードを書く能力より、AIが書いたコードの品質を判断し、システム全体のアーキテクチャを設計する能力のほうが希少で高価値になる。
一方で、再帰的自己改善が実現しないシナリオもある。現在の進歩がスケーリング則の延長線上にあるなら、どこかで壁にぶつかる。Anthropicのレポートも「不可避ではない」と書いている。ただし、壁があるかどうかを確かめるために走り続けるというのは、ブレーキの有無を確認せずに高速道路を走るようなものだ。
だからこそ「止められる仕組みを作ろう」という提案には、ポジショントークかどうかに関わらず、合理性がある。問題は誰がその仕組みを設計し、誰が監視するかだ。
Anthropic「When AI builds itself」(2026年6月4日)
関連記事
Claudeを悪用した832件のサイバー攻撃を分析 — Anthropicが公開したAI脅威レポートの中身
Anthropicが832アカウントのAI悪用を1年間分析しMITRE ATT&CKにマッピング。AI利用率33%→56%、マルウェア開発67%。LLM ATT&CK Navigatorの内容を解説。
AnthropicがOpenAIを追い越した日 — 評価額140兆円、IPO申請、そして「嘘をつかなくなった」Opus 4.8
Anthropicが$965B評価で$65B調達、6月1日にIPO申請。同時にClaude Opus 4.8をリリース。ARR $47B、OpenAI超え、そして「より正直になった」モデルの中身を整理する。
$965B、S-1提出、初の黒字 — Anthropicが「AI企業で最も高い値段」をつけられた72時間の全記録
Anthropicが$65B調達で評価額$965Bに到達、翌日S-1をSEC提出。OpenAI超えの背景、IPOレースの行方、日本市場への影響を分析する。