FlowTune Media

TikTokの親会社が作った「何でも屋AI」が静かにベンチマークを塗り替えている — Seed 1.8の正体

OpenAI、Google、Anthropicの三つ巴に注目が集まるなか、ほとんど報道されていないモデルがある。ByteDanceのSeedチームが公開したSeed 1.8だ。

Seed 1.8

TikTokの親会社が作ったAIモデルと聞くと、動画推薦アルゴリズムの延長を想像するかもしれない。実態は違う。Seed 1.8はテキストと画像を入力に取り、Web検索、コード生成、画面操作、複数ステップのワークフローをこなす汎用エージェントモデルだ。しかもBrowseComp-enベンチマークで67.6を記録し、Gemini 3 Proを上回っている。

なぜこのモデルが話題にならないのか。おそらく理由は単純で、ByteDanceのAI部門「Seed」の知名度が西側メディアでまだ低いからだ。だがDoubao(豆包)という名前なら聞いたことがある人もいるだろう。中国国内で1日120兆トークンを処理している巨大チャットサービスの基盤が、このSeed 1.8である。

「何でもやるAI」の具体像

Seed 1.8が面白いのは、汎用性の定義が他のモデルとやや違うところだ。

GPT-6やClaude Opus 4.7が「どんな質問にも答えられる」汎用性を追求しているのに対し、Seed 1.8は**「どんなツールでも使いこなす」**方向の汎用性を目指している。具体的には、Webブラウザを開いて情報を検索し、デスクトップアプリのGUIをクリック操作し、途中でコードを書いて実行し、結果を統合して返す——という一連の流れを1つのモデルで完結させる。

これはCodexの最新アップデートが追加した「Computer Use」や、Claude Coworkのデスクトップ操作と重なる能力だが、Seed 1.8はこれをモデルレベルで統合している点が異なる。プラグインやツール連携ではなく、モデル自体がGUI操作を理解している。

ベンチマークの読み方

公開されている数値をいくつか整理する。

BrowseComp-en(Web検索能力)で67.6。これはGemini 3 Proを上回る水準だ。WorldTravel(旅行計画タスク)では47.2を記録し、マルチモーダルな実務タスクでの信頼性を示している。通常のLLMベンチマーク(推論・知識・指示追従)でもフロンティアモデルに匹敵する性能を維持している。

ただ、ベンチマークの選び方にはByteDanceの意図が透ける。BrowseCompやWorldTravelは「エージェント的な行動」を測るベンチマークであり、GPQAやMMLUのような一般的な学力テストではない。Seed 1.8が得意な領域で測っている、ということは頭に入れておく必要がある。

推論コストの工夫

Seed 1.8は「思考モード」を4段階(minimal / low / medium / high)で切り替えられる。すべてのタスクに深い推論が必要なわけではないから、簡単なタスクにはminimalモードで高速・低コストに処理し、複雑なタスクだけhighモードを使う。

API料金は入力$0.25/100万トークン、出力$2/100万トークン。これはGPT-6の入力$5/100万トークンの20分の1にあたる。DeepSeekと同じ価格破壊路線だ。日本円に換算すると、100万トークンの入力が約37円、出力が約300円。個人開発者でも気軽に試せる水準にある。

DeepInfraなど海外の推論プラットフォームでもホスティングされており、日本からでもAPI経由で利用可能だ。

ByteDanceの「三本柱」戦略

ByteDanceのAI戦略を理解するには、Seedチームが手がける3つの柱を見る必要がある。

Seed(言語モデル): Doubaoの基盤。Seed 1.8がエージェント能力を担う。すでにSeed 2.0の開発も進んでいる。

Seedance(動画生成): Seedance 2.0として日本でも話題になった動画生成モデル。マルチショット映画シーケンスを60秒で生成する能力が注目された。

Seedream(画像生成): テキストから画像を生成するモデル。Seedream 5.0が最新版。

この三本柱がすべてDoubaoに統合されている。テキストで指示を出し、コードを書かせ、動画や画像を生成させ、Web検索やGUI操作もやらせる——Doubaoが目指しているのは、中国版のスーパーアプリだ。

率直な所感

技術的には素直にすごい。モデルレベルでGUI操作を統合しているアプローチは、ツール連携で実現するOpenAIやAnthropicとは異なる哲学で、コンテキスト効率が良い。価格はDeepSeek並みに安い。

ただ、日本のユーザーが日常的に使う場面はまだ限られる。Doubaoアプリは中国市場向けで、日本語対応はAPI経由で使う場合に限られる。エージェント機能のGUI操作も、中国のWebサービスやアプリに最適化されている可能性が高い。

それでもSeed 1.8を知っておく価値はある。DeepSeekが「安くて賢いモデル」で世界を驚かせたように、ByteDanceが「安くて何でもやるエージェント」で同じことを起こす可能性は十分にある。Doubaoの1日120兆トークンという実績は、そのスケールが荒唐無稽ではないことを証明している。

Seed 1.8 公式ブログ — ByteDance Seed

関連記事