FlowTune Media

Soraが消えた世界で、Grok Imagineが静かに「1秒5円」の動画生成インフラになっていた

3ヶ月前、AI動画生成の勢力図はまったく違っていた。

2026年1月時点では、OpenAIのSora、GoogleのVeo、RunwayのGen-4——この3つが「御三家」として君臨し、xAIのGrokは画像生成こそ話題になっていたものの、動画についてはノーマークに近かった。

それが4月の今、状況は一変している。Soraは3月25日に消費者向けサービスを停止し、4月26日にはアプリ完全終了が決まった。Runwayは高品質だが高コスト路線から降りる気配がない。その間にGrok Imagineは、APIローンチから動画延長、モード追加まで怒涛のアップデートを重ね、月間12億本超の動画を生成するプラットフォームに成長した。

振り返ると、この3ヶ月の展開はかなり鮮やかだ。時系列で整理する。

1月28日 — APIローンチで開発者に門戸を開く

xAIはGrok Imagine APIを公開し、テキストから動画(text-to-video)、画像から動画(image-to-video)、動画編集(video editing)の3エンドポイントを一気に提供した。

注目すべきは価格だ。720p動画の生成が1秒あたり$0.05(約7.5円)。10秒の動画で$0.50、1分で$4.20。Google Veo 3.1が1秒あたり$0.40〜$0.75であることを考えると、8〜15倍の価格差がある。

解像度は720pでVeoの1080p〜4Kには及ばない。だが、SNS向けのショート動画やプロトタイプ制作なら720pで十分実用的だ。この価格なら「とりあえず100パターン生成して選ぶ」という使い方が現実的になる。動画生成AIが「高級品」から「日常ツール」に変わる転換点だったと思う。

2月2日 — Grok Imagine 1.0で動画の質が跳ねる

Grok Imagine 1.0として、10秒・720p・音声付き動画の生成が解禁された。「音声付き」がポイントで、映像にBGMや効果音が自動で付く。他のAI動画ツールでは映像と音声を別々に生成して合成する手間がかかるが、Grok Imagineはワンステップで完結する。

この「映像+音声の一体生成」は地味に大きい。SNSに投稿する動画は無音だと見てもらえない。効果音やBGMがあるだけでエンゲージメントが変わる。その工程を省略できるのは、特にXで日常的にコンテンツを発信しているユーザーには直接的なメリットだ。

3月2日 — Extend from Frameで「連続する物語」が可能に

個人的に、このアップデートが一番インパクトが大きいと感じている。

「Extend from Frame」は、生成した動画の最終フレームを次の動画の開始点として使い、クリップを連鎖させる機能だ。1本10秒の制限を超えて、30秒、1分と続くシーケンスを作れるようになった。動きの方向、キャラクターの位置、ライティング——これらが次のクリップに引き継がれるため、つなぎ目が自然になる。

ただし正直に書くと、限界もある。コミュニティのテストでは、2〜3回の連鎖を超えると画質が目に見えて劣化するという報告が出ている。フレーム間の整合性を維持しながら複数回のインファレンスを通すのは技術的に難しい問題で、現時点では「短い物語を2〜3シーン」が実用的な上限だろう。

それでも、「1カットの素材生成」から「複数カットのストーリーテリング」に踏み出した意義は大きい。プロモーション動画やSNS向けのミニストーリーなど、活用の幅が明確に広がった。

4月3日 — Quality/Speedモードで用途別に最適化

最新のアップデートで、生成モードが2つに分かれた。Speedモードは従来通りの高速連続生成、Qualityモードはディテールと精度を重視した4枚出し。さらに月末にはPro モードの追加が予告されており、1080pの画像・動画生成に対応する見込みだ。

このモード分岐は、Grok Imagineのユーザー層が広がったことの反映だろう。アイデア検証ならSpeed、納品物ならQuality、商用ならPro。用途に応じて品質と速度のバランスを選べるのは合理的な進化である。

Proモードが1080p対応で実用に耐えるものになれば、Grok ImagineはRunway Gen-4.5やVeo 3.1と同じ土俵に上がることになる。価格優位がそのまま維持されるなら、特に中小規模のクリエイターやマーケターにとっては有力な選択肢だ。

Soraが消えた穴を埋めたのか

Soraの停止理由は端的に言えば「コストに見合う利用がなかった」ことだ。OpenAIは計算リソースをコーディングや推論に振り向ける判断をした。AI動画生成は儲からない——少なくともOpenAIにとっては。

Grok Imagineが同じ轍を踏まない保証はないが、アプローチは対照的だ。Soraが高品質・高コストで商業映像を狙ったのに対し、Grok Imagineは低価格・大量生成でSNSコンテンツの裾野を押さえにいっている。月12億本という生成数が示すように、「安くて速い」需要は確実に存在する。

Veo 3.1は無料枠を開放して間口を広げ、Grok Imagineは有料だがAPI単価で圧倒する。戦略は違うが、どちらも「AI動画を特別なものでなくす」方向に動いている。

率直に思うこと

Grok Imagineの3ヶ月間の進化速度は、正直に言って速い。APIローンチからモード分岐まで、月1回以上のペースで主要機能を追加してきた。xAIのリソース投下の本気度を感じる。

一方で、気になる点もある。

720pの解像度はSNSでは十分だが、ビジネス用途ではやはり物足りない。Proモードの1080p対応がいつ、どの品質で実現するかが今後の分岐点になる。また、Grok Imagineを使うにはXアカウントまたはgrok.comからのアクセスが必要で、Xプラットフォームとの密結合は好き嫌いが分かれるだろう。さらに、3月末に無料枠が廃止された点も、新規ユーザーの獲得にはマイナスだ。

とはいえ、API経由で$0.05/秒という価格は破壊的だ。動画生成をプロダクトに組み込みたい開発者にとって、コスト面でのハードルが桁違いに下がる。「AI動画APIを叩いて自動でSNS投稿を量産する」ようなワークフローが、個人開発者にも手の届く価格帯に入ったのは大きな変化である。

今すぐGrok Imagineを検討すべきなのは、SNS向けのショート動画を大量に回すマーケターや、動画生成をアプリに組み込みたい開発者だろう。逆に、4K品質の映像制作やブランド映像を求めるなら、まだVeo 3.1やRunway Gen-4.5に分がある。Proモードの実力次第でこの棲み分けが崩れる可能性はあるが、現時点では「用途で選ぶ」のが現実的だ。xAIがこのペースで機能拡張を続けるなら、2026年後半にはAI動画生成の価格基準そのものをGrok Imagineが書き換えているかもしれない。

参考リンク

関連記事