訓練コスト94%削減でDeepSeekを超えた — Baiduの新モデルERNIE 5.1が示す「安く作って強い」の現実解
訓練コストが従来の6%。パラメータ数は3分の1。それでいて、数学の難問を解く能力はGemini 3.1 Proに次ぐ世界2位——。
5月9日にBaiduが発表したERNIE 5.1の数字は、一見すると「話が美味すぎる」。だが、蓋を開けてみると技術的な裏付けがある。そしてその裏付けが、AIモデル開発のコスト構造を根本から問い直すものになっている。
数字の整理
まず事実を並べる。
ERNIE 5.1はArena Search(LLMの総合評価ランキング)で世界4位、中国モデル1位のスコア1,223を記録した。数学ベンチマークAIME26ではツール使用ありで99.6点。これはGemini 3.1 Proに次ぐ2位で、DeepSeek V4 Proの92.6点、Claude Opus 4.6の81.2点を上回る。
エージェント能力を測るτ³-benchとSpreadsheetBench-Verifiedでも、DeepSeek V4 Proを超えた。
「中国のモデルが頑張っている」程度の話ではない。フロンティアモデルと正面から数字を競えるレベルに到達している。
94%削減の正体:Once-For-All弾性学習
「訓練コスト6%」という数字が本当なら革命的だが、正確に理解するには文脈が必要だ。
ERNIE 5.1は、ゼロから訓練されたモデルではない。前世代のERNIE 5.0の訓練基盤を引き継ぎ、そこから最適なサブネットワークを抽出する「Once-For-All弾性学習フレームワーク」で構築されている。
このフレームワークは3つの軸で伸縮する。Transformerの層をランダムにスキップする弾性深度。MoE(Mixture of Experts)層のエキスパートを動的にマスクする弾性幅。そしてTop-kルーティングでアクティブなエキスパート数を柔軟に変える弾性スパース性。
要するに、1回の大規模な訓練ランの中で、サイズの異なるモデルファミリー全体を同時に最適化している。個別のモデルサイズごとにゼロから訓練し直す必要がないため、コストが劇的に下がる。「94%削減」は、この構造的な効率化によるものだ。
正直に言えば、「ERNIE 5.0の訓練コストを含めれば本当に6%か?」という疑問は残る。しかし少なくとも「同規模のモデルをスクラッチで訓練する場合と比較して6%」という主張には、技術的な根拠がある。そしてこのアプローチ自体は、他のモデル開発者にとっても参考になるはずだ。
DeepSeekとの距離感
中国AI市場でERNIE 5.1の最大の比較対象は、言うまでもなくDeepSeek V4だ。
DeepSeek V4 Proは1.6兆パラメータ(アクティブ490億)のMoEモデルで、4月にリリースされたばかり。オープンウェイトで提供されている。対するERNIE 5.1はパラメータ数を公開していないが、前世代の3分の1に圧縮されたとされる。
ベンチマーク上の勝ち負けは混在している。数学(AIME26)とエージェントタスクではERNIE 5.1がリード。一方、汎用的な対話やコーディングの指標ではDeepSeek V4 Proが優勢とされるレポートもある。
大きな違いはアクセス性にある。DeepSeek V4はオープンウェイトで誰でもダウンロードして使える。ERNIE 5.1はBaiduのプラットフォーム経由でのみ利用可能だ。開発者コミュニティとの距離感は、DeepSeekのほうが圧倒的に近い。
日本のユーザーには関係あるのか
正直に言えば、ERNIE 5.1を日本から直接使う機会はほとんどない。BaiduのAPIは中国市場が主戦場で、海外開発者向けのドキュメントやサポートはDeepSeekと比べても限定的だ。
しかし、このモデルが示したことには意味がある。
一つは、訓練効率の競争が本格化していることだ。DeepSeekが「安い推論」でOpenAIを揺さぶったように、BaiduはERNIE 5.1で「安い訓練」の可能性を示した。Once-For-All弾性学習のような手法が一般化すれば、フロンティアモデルの開発コストは今後数年で劇的に下がるかもしれない。それは最終的に、APIの利用料金として私たちに返ってくる。
もう一つは、中国AI勢がそれぞれ異なる武器で戦い始めていることだ。「六小虎」と呼ばれる新興勢ではDeepSeekがオープンソースとコスト効率で突破口を開き、MiniMaxが動画生成で存在感を示し、StepFunがIPOに動いている。そこにBaiduのような大手が訓練効率とエージェント能力で切り込んでくる。一つの手法が独占する構造ではなく、スタートアップと巨人が異なるアプローチで同時に進化している。
AI開発の「正解のルート」がまだ定まっていない——ERNIE 5.1の登場は、その事実を改めて確認させてくれる。GPUをとにかく積み上げて巨大モデルを力技で訓練する時代から、構造的な工夫で効率を絞り出す時代へ。Baiduは地味なプレイヤーだが、この方向転換の象徴的な存在になりつつある。
関連記事
80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日
OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。
35時間放置したらコードが10倍速くなっていた — Qwen 3.7 Maxの自律コーディング実験
Qwen 3.7 Maxが知能指数1位。Opus比1/10の料金で35時間自律コーディング。性能と制約を整理
12日間で4社が出揃った — 中国AIコーディングモデル比較、どれを使うのが正解か
GLM-5.1・Kimi K2.6・DeepSeek V4・MiniMax M2.7を料金・性能で横並び比較。用途別の選び方を解説。