FlowTune Media

Xiaomiが出したOSSコーディングエージェント、200ステップ超でClaude Codeに勝つ

AIコーディングエージェントには、ある臨界点がある。

タスクのステップ数が100を超えたあたりから、多くのエージェントは挙動がおかしくなり始める。ファイルの存在を忘れる。同じコマンドを繰り返す。200ステップを超えると、Claude Codeですら「ターミナルの幻覚」——存在しない出力を参照し始めるループに陥ることがあるという。

この長大タスクの壁を正面から攻略しに来たのが、スマートフォン大手Xiaomi(シャオミ)のAIチーム「MiMo」が6月10日にオープンソースで公開したMiMo Codeだ。

スマホ屋がなぜコーディングエージェントを?

Xiaomiがスマートフォンとスマート家電の会社だと思っているなら、認識のアップデートが要る。同社は2024年からAI基盤モデル「MiMo」シリーズの開発を進めており、100万トークンのコンテキストウィンドウを持つマルチモーダルモデル「MiMo-V2.5-Pro」を自社で運用している。

MiMo Codeはその基盤モデルを実作業に活かすための「ハーネス」(制御枠組み)だ。ターミナル上で動き、ファイル操作、bash実行、依存関係の管理、テスト実行までを自律的にこなす。OpenCodeをベースに構築され、MIT ライセンスで公開されている。

200ステップを超えても破綻しない3つの仕組み

MiMo Codeの核心は「長く走り続けても壊れない」設計にある。

Max Mode(並列候補生成)。 各ターンでN個(デフォルト5つ)の候補解を並列に生成する。それぞれが独立して推論とツール実行計画を立てるが、実際に実行はしない。同じモデルが審査員となり、全候補の推論過程と計画を比較して最良のものだけを実行する。一手ごとに「5人のエンジニアに案を出させて、最も筋のいい案を採用する」イメージだ。

プロジェクトメモリ。 セッションをまたいで知識を保持するMarkdown形式のメモリファイルを維持する。プロジェクトの背景、ユーザーが指定したルール、アーキテクチャ決定の理由、検証済みの技術的事実——これらがファイルシステム上に永続化される。従来のエージェントが10〜20ステップで文脈を失うのは、メモリがセッション内のトークンに依存しているからだ。MiMo Codeはメモリを外部化することでこの問題を回避する。

チェックポイント。 全てのbashコマンド、ファイル変更、依存関係のインストールを記録し、事前定義されたインターバルで開発者がロジックを確認できる。AIが暴走した場合、チェックポイントまで巻き戻して修正できる。

ベンチマーク — 数字の読み方に注意

Xiaomiが公表した数字を見てみる。同じMiMo-V2.5-Proモデルで、MiMo Codeハーネスの上で走らせた場合とClaude Codeハーネスの上で走らせた場合の比較だ。

ベンチマーク MiMo Code Claude Code(同モデル)
SWE-bench Pro 62% 57%
Terminal-Bench 2 73% 68%

約5ポイントの差。これはモデルの差ではなくハーネス(制御枠組み)の差だという主張になる。

ただし、注意点がある。

第一に、これは自己申告のベンチマークだ。第三者による独立検証はまだ出ていない。第二に、Terminal-Bench 2の公式リーダーボードではOpenAI Codex CLI(GPT-5.5搭載)が82.2%を記録しており、MiMo Codeの73%はそれより9ポイント低い。Claude Code「に」勝ったのは事実でも、全体の中での立ち位置は上位とは言い切れない。

200ステップ超のタスクに限定すると、勝率は65%以上に上がるとXiaomiは主張している。長いタスクほど強いという特性が本物なら、複雑なリファクタリングやマイグレーション作業で威力を発揮するだろう。

導入方法 — 1行で入る

macOS / Linuxの場合:

curl -fsSL https://mimo.xiaomi.com/install | bash

Windowsの場合:

npm install -g @mimo-ai/cli

初期状態ではMiMo-V2.5モデルに無料でアクセスできる(期間限定)。DeepSeek、Kimi、GLMなどのサードパーティバックエンドや、OpenAI互換のAPIにも切り替えられる。

中国テック大手のAIコーディング参入が意味すること

Xiaomiの参入で面白いのは、コーディングエージェント市場が「アメリカのAI企業同士の競争」から一段広がったことだ。

Claude Code(Anthropic)、Codex CLI(OpenAI)、Gemini CLI(Google)、Devin(Cognition)——これまでの主要プレイヤーは全てアメリカ企業だった。そこにXiaomiが完全OSSで殴り込みをかけた。MIT ライセンスなので、誰でもフォークして商用利用できる。

正直なところ、現時点のMiMo Codeが日常のコーディングワークフローでClaude CodeやCodex CLIを置き換えるかというと、難しいだろう。エコシステムの成熟度、ドキュメントの充実度、コミュニティの規模で大きな差がある。

だが「モデルが同じなら、ハーネスの設計で性能が変わる」という実証は価値がある。Max Modeの並列候補生成やプロジェクトメモリの外部化は、他のエージェントにも取り入れられるアイデアだ。OSSとして公開されたことで、これらの設計パターンがコーディングエージェント全体の進化を加速させる可能性がある。

関連記事