TikTokの親会社が作った「何でも屋AI」が静かにベンチマークを塗り替えている — Seed 1.8の正体
OpenAI、Google、Anthropicの三つ巴に注目が集まるなか、ほとんど報道されていないモデルがある。ByteDanceのSeedチームが公開したSeed 1.8だ。

TikTokの親会社が作ったAIモデルと聞くと、動画推薦アルゴリズムの延長を想像するかもしれない。実態は違う。Seed 1.8はテキストと画像を入力に取り、Web検索、コード生成、画面操作、複数ステップのワークフローをこなす汎用エージェントモデルだ。しかもBrowseComp-enベンチマークで67.6を記録し、Gemini 3 Proを上回っている。
なぜこのモデルが話題にならないのか。おそらく理由は単純で、ByteDanceのAI部門「Seed」の知名度が西側メディアでまだ低いからだ。だがDoubao(豆包)という名前なら聞いたことがある人もいるだろう。中国国内で1日120兆トークンを処理している巨大チャットサービスの基盤が、このSeed 1.8である。
「何でもやるAI」の具体像
Seed 1.8が面白いのは、汎用性の定義が他のモデルとやや違うところだ。
GPT-6やClaude Opus 4.7が「どんな質問にも答えられる」汎用性を追求しているのに対し、Seed 1.8は**「どんなツールでも使いこなす」**方向の汎用性を目指している。具体的には、Webブラウザを開いて情報を検索し、デスクトップアプリのGUIをクリック操作し、途中でコードを書いて実行し、結果を統合して返す——という一連の流れを1つのモデルで完結させる。
これはCodexの最新アップデートが追加した「Computer Use」や、Claude Coworkのデスクトップ操作と重なる能力だが、Seed 1.8はこれをモデルレベルで統合している点が異なる。プラグインやツール連携ではなく、モデル自体がGUI操作を理解している。
ベンチマークの読み方
公開されている数値をいくつか整理する。
BrowseComp-en(Web検索能力)で67.6。これはGemini 3 Proを上回る水準だ。WorldTravel(旅行計画タスク)では47.2を記録し、マルチモーダルな実務タスクでの信頼性を示している。通常のLLMベンチマーク(推論・知識・指示追従)でもフロンティアモデルに匹敵する性能を維持している。
ただ、ベンチマークの選び方にはByteDanceの意図が透ける。BrowseCompやWorldTravelは「エージェント的な行動」を測るベンチマークであり、GPQAやMMLUのような一般的な学力テストではない。Seed 1.8が得意な領域で測っている、ということは頭に入れておく必要がある。
推論コストの工夫
Seed 1.8は「思考モード」を4段階(minimal / low / medium / high)で切り替えられる。すべてのタスクに深い推論が必要なわけではないから、簡単なタスクにはminimalモードで高速・低コストに処理し、複雑なタスクだけhighモードを使う。
API料金は入力$0.25/100万トークン、出力$2/100万トークン。これはGPT-6の入力$5/100万トークンの20分の1にあたる。DeepSeekと同じ価格破壊路線だ。日本円に換算すると、100万トークンの入力が約37円、出力が約300円。個人開発者でも気軽に試せる水準にある。
DeepInfraなど海外の推論プラットフォームでもホスティングされており、日本からでもAPI経由で利用可能だ。
ByteDanceの「三本柱」戦略
ByteDanceのAI戦略を理解するには、Seedチームが手がける3つの柱を見る必要がある。
Seed(言語モデル): Doubaoの基盤。Seed 1.8がエージェント能力を担う。すでにSeed 2.0の開発も進んでいる。
Seedance(動画生成): Seedance 2.0として日本でも話題になった動画生成モデル。マルチショット映画シーケンスを60秒で生成する能力が注目された。
Seedream(画像生成): テキストから画像を生成するモデル。Seedream 5.0が最新版。
この三本柱がすべてDoubaoに統合されている。テキストで指示を出し、コードを書かせ、動画や画像を生成させ、Web検索やGUI操作もやらせる——Doubaoが目指しているのは、中国版のスーパーアプリだ。
率直な所感
技術的には素直にすごい。モデルレベルでGUI操作を統合しているアプローチは、ツール連携で実現するOpenAIやAnthropicとは異なる哲学で、コンテキスト効率が良い。価格はDeepSeek並みに安い。
ただ、日本のユーザーが日常的に使う場面はまだ限られる。Doubaoアプリは中国市場向けで、日本語対応はAPI経由で使う場合に限られる。エージェント機能のGUI操作も、中国のWebサービスやアプリに最適化されている可能性が高い。
それでもSeed 1.8を知っておく価値はある。DeepSeekが「安くて賢いモデル」で世界を驚かせたように、ByteDanceが「安くて何でもやるエージェント」で同じことを起こす可能性は十分にある。Doubaoの1日120兆トークンという実績は、そのスケールが荒唐無稽ではないことを証明している。
関連記事
WeChatの13億ユーザーにAIエージェントが届く — Tencent Hunyuan 3.0が意味すること
Tencentが次世代LLM Hunyuan 3.0を4月にリリース予定。300億パラメータ、WeChat AIエージェント統合、元OpenAI研究者が主導する開発体制を整理する。
1つのDevinが10のDevinを動かす — 並列エージェント「Managed Devins」の仕組みと代償
Devinの新機能Managed Devinsを解説。親Devinがタスクを分割し最大10の子Devinに委任する並列実行の仕組み、Cursor 3やClaude Codeとの違い、料金への影響を整理する。
Claudeが「バカになった」問題の全貌 — 6,852セッションの分析データと、Anthropicが認めたこと
2026年4月、Claude Codeの品質低下がAMD責任者の実データ分析で裏付けられた。effort level変更の経緯、Anthropicの公式見解、ユーザーが取れる対策を時系列で整理する。