Xiaomiが出したOSSコーディングエージェント、200ステップ超でClaude Codeに勝つ
AIコーディングエージェントには、ある臨界点がある。
タスクのステップ数が100を超えたあたりから、多くのエージェントは挙動がおかしくなり始める。ファイルの存在を忘れる。同じコマンドを繰り返す。200ステップを超えると、Claude Codeですら「ターミナルの幻覚」——存在しない出力を参照し始めるループに陥ることがあるという。
この長大タスクの壁を正面から攻略しに来たのが、スマートフォン大手Xiaomi(シャオミ)のAIチーム「MiMo」が6月10日にオープンソースで公開したMiMo Codeだ。
スマホ屋がなぜコーディングエージェントを?
Xiaomiがスマートフォンとスマート家電の会社だと思っているなら、認識のアップデートが要る。同社は2024年からAI基盤モデル「MiMo」シリーズの開発を進めており、100万トークンのコンテキストウィンドウを持つマルチモーダルモデル「MiMo-V2.5-Pro」を自社で運用している。
MiMo Codeはその基盤モデルを実作業に活かすための「ハーネス」(制御枠組み)だ。ターミナル上で動き、ファイル操作、bash実行、依存関係の管理、テスト実行までを自律的にこなす。OpenCodeをベースに構築され、MIT ライセンスで公開されている。
200ステップを超えても破綻しない3つの仕組み
MiMo Codeの核心は「長く走り続けても壊れない」設計にある。
Max Mode(並列候補生成)。 各ターンでN個(デフォルト5つ)の候補解を並列に生成する。それぞれが独立して推論とツール実行計画を立てるが、実際に実行はしない。同じモデルが審査員となり、全候補の推論過程と計画を比較して最良のものだけを実行する。一手ごとに「5人のエンジニアに案を出させて、最も筋のいい案を採用する」イメージだ。
プロジェクトメモリ。 セッションをまたいで知識を保持するMarkdown形式のメモリファイルを維持する。プロジェクトの背景、ユーザーが指定したルール、アーキテクチャ決定の理由、検証済みの技術的事実——これらがファイルシステム上に永続化される。従来のエージェントが10〜20ステップで文脈を失うのは、メモリがセッション内のトークンに依存しているからだ。MiMo Codeはメモリを外部化することでこの問題を回避する。
チェックポイント。 全てのbashコマンド、ファイル変更、依存関係のインストールを記録し、事前定義されたインターバルで開発者がロジックを確認できる。AIが暴走した場合、チェックポイントまで巻き戻して修正できる。
ベンチマーク — 数字の読み方に注意
Xiaomiが公表した数字を見てみる。同じMiMo-V2.5-Proモデルで、MiMo Codeハーネスの上で走らせた場合とClaude Codeハーネスの上で走らせた場合の比較だ。
| ベンチマーク | MiMo Code | Claude Code(同モデル) |
|---|---|---|
| SWE-bench Pro | 62% | 57% |
| Terminal-Bench 2 | 73% | 68% |
約5ポイントの差。これはモデルの差ではなくハーネス(制御枠組み)の差だという主張になる。
ただし、注意点がある。
第一に、これは自己申告のベンチマークだ。第三者による独立検証はまだ出ていない。第二に、Terminal-Bench 2の公式リーダーボードではOpenAI Codex CLI(GPT-5.5搭載)が82.2%を記録しており、MiMo Codeの73%はそれより9ポイント低い。Claude Code「に」勝ったのは事実でも、全体の中での立ち位置は上位とは言い切れない。
200ステップ超のタスクに限定すると、勝率は65%以上に上がるとXiaomiは主張している。長いタスクほど強いという特性が本物なら、複雑なリファクタリングやマイグレーション作業で威力を発揮するだろう。
導入方法 — 1行で入る
macOS / Linuxの場合:
curl -fsSL https://mimo.xiaomi.com/install | bash
Windowsの場合:
npm install -g @mimo-ai/cli
初期状態ではMiMo-V2.5モデルに無料でアクセスできる(期間限定)。DeepSeek、Kimi、GLMなどのサードパーティバックエンドや、OpenAI互換のAPIにも切り替えられる。
中国テック大手のAIコーディング参入が意味すること
Xiaomiの参入で面白いのは、コーディングエージェント市場が「アメリカのAI企業同士の競争」から一段広がったことだ。
Claude Code(Anthropic)、Codex CLI(OpenAI)、Gemini CLI(Google)、Devin(Cognition)——これまでの主要プレイヤーは全てアメリカ企業だった。そこにXiaomiが完全OSSで殴り込みをかけた。MIT ライセンスなので、誰でもフォークして商用利用できる。
正直なところ、現時点のMiMo Codeが日常のコーディングワークフローでClaude CodeやCodex CLIを置き換えるかというと、難しいだろう。エコシステムの成熟度、ドキュメントの充実度、コミュニティの規模で大きな差がある。
だが「モデルが同じなら、ハーネスの設計で性能が変わる」という実証は価値がある。Max Modeの並列候補生成やプロジェクトメモリの外部化は、他のエージェントにも取り入れられるアイデアだ。OSSとして公開されたことで、これらの設計パターンがコーディングエージェント全体の進化を加速させる可能性がある。
関連記事
AIにPCを操作させる機能、設定ゼロで使えるようになった — Qwen Code v0.17
Qwen Code v0.17でComputer Use(デスクトップ自動操作)がゼロコンフィグの組み込み機能に。9つの操作ツール、モデル非依存、無料で使える仕組みを解説。
10万スターのOSSが突然クローズドに — Gemini CLI廃止と「Antigravity移行」で開発者が怒っている理由
GoogleがGemini CLIを6月18日に廃止し、クローズドソースのAntigravity CLIへ強制移行。10万スター・6000PRのOSSプロジェクト閉鎖の経緯、影響範囲、代替手段を整理する。
Cline SDKが出た — 500万人が使うVS Code拡張の「中身」がそのままオープンソースに
Cline SDKはVS Code拡張の内部エージェントランタイムをオープンソース化したもの。アーキテクチャ、プラグイン、Kanbanボード、Claude Code SDKとの違いを解説。