FlowTune Media

ロボットの「脳」だけを作る会社に675億円が集まった — Rhoda AIの賭け

ロボットのデモ動画は、いつも完璧だ。

整然としたラボの中で、ロボットアームが部品をつかみ、正確に組み立てる。照明は最適化され、対象物の位置は毎回同じ。視聴者は感心する。だが現実の工場や倉庫にそのロボットを置くと、途端に動かなくなる。照明が変わる。部品の向きがずれている。隣の作業員が予想外の動きをする。ラボで99%の成功率を出したロボットが、現場では使い物にならない。

この「ラボと現実のギャップ」を埋めるために18ヶ月のステルス期間を費やし、$450M(約675億円)のSeries Aを調達して登場したのがRhoda AIだ。

動画でロボットに物理法則を教える

Rhoda AIのアプローチは、ロボット業界の常識から外れている。

従来のロボットAIは、シミュレーション環境で訓練するか、人間が操作した軌跡データ(テレオペレーション)から学習する。Rhodaは違う。インターネット上の数億本の動画を使って事前学習する。

人が棚から物を取る。料理中に材料を切る。工具で何かを組み立てる。こうした無数の動画から、モデルは物体の動き方、重力の影響、接触時の物理的挙動を学ぶ。テキストで学んだLLMが言語を理解するように、動画で学んだRhodaのモデルは物理世界を理解する。

この基盤の上に構築されたのがFutureVisionと呼ばれるフレームワークであり、その中核がDVA(Direct Video Action)アーキテクチャだ。DVAの特徴は、知覚と制御を一体化している点にある。従来の「見る→計画する→動かす」というパイプラインではなく、映像を入力として受け取りながらリアルタイムで動作を生成する。環境が変わればその場で行動を修正する。

10時間で新しい仕事を覚える

事前学習で得た物理法則の理解があるため、新しいタスクへの適応が速い。公式発表によると、わずか10時間のテレオペレーションデータで新タスクを学習できるという。従来の手法では数百〜数千時間を要することもあった。

実際の製造環境での評価では、部品処理ワークフローを1サイクル2分未満で完了し、人間の介入なしに顧客のKPIを超えたと報告されている。ラボではなく、本番の工場での数字だ。

$1.7Bの評価額と投資家の顔ぶれ

$450MのSeries Aでバリュエーションは$1.7B(約2,550億円)。ロボットAI単独のラウンドとしては2026年最大級だ。

投資家の顔ぶれも重い。Khosla Ventures、Temasek(シンガポール政府系ファンド)、John Doerr(個人)、Mayfield、Premji Investなど。創業者のJagdeep Singhは、固体電池のQuantumScapeを立ち上げた連続起業家。CTOのEric Ryan Chanはスタンフォード出身でWorldLabsの元アーキテクト。共同創業者のGordon Wetzsteinはスタンフォード大学のコンピュテーショナル・イメージング研究室を率いる教授だ。

アカデミアと産業の両方から人材を集めているのは、基礎研究と実用化の両輪を回す意思の表れだろう。

Figure AIとの違い

ロボットAI領域で最も資金を集めているのはFigure AIだ。累計$1.9B以上を調達し、バリュエーション$39B。ヒューマノイドロボット(Figure 01〜03)とVLAモデル(Helix 01〜02)の両方を自社開発している。

Rhodaの立ち位置はFigureと異なる。Rhodaは「脳」に特化している。自社でもハードウェアを開発する計画はあるが、FutureVisionの知能レイヤーを他社のロボットハードウェアにもライセンス提供する方針だ。ロボット界のAnthropicとでも言うべきか — 基盤モデルを作り、プラットフォームとして広げる戦略を取っている。

競合としては、e-コマースの梱包向けモデルを公開したPhysical Intelligence(Pi)や、物理的常識をデータから学ぶGeneralist AIも挙げられる。フィジカルAI領域は2026年に入って急速に投資が集まっており、Eclipse Venturesが$1BのフィジカルAI特化ファンドを組成するなど、インフラ層の整備も進んでいる。

冷静に見ると

675億円という数字は華やかだが、懸念もある。

動画から物理法則を学ぶアプローチは理論的に美しいが、インターネット動画と実際のロボット操作環境には大きなドメインギャップがあるはずだ。料理動画で包丁の動きを学んでも、工場の精密部品の取り扱いにどこまで転移するのかは、公開情報だけでは判断しにくい。

また、Rhodaの実績として挙げられている製造現場のデモは印象的だが、対象タスクの複雑さや条件の詳細は限定的にしか公開されていない。ロボットAIスタートアップの「デモと現実の乖離」を解決すると謳う会社が、自身のデモをどこまでオープンにできるかは今後の試金石になる。

それでも、「動画で物理を学ぶ」というスケーラブルなアプローチと、10時間で新タスクを習得できるという適応速度は、実現すれば産業ロボットの導入コストを根本から変える可能性がある。LLMがテキストの世界で起こした革命が、物理世界でも起きるかもしれない。その最前線にいるのがRhoda AIだ。

関連記事