Soraが死んだ — 代わりに使えるAI動画生成ツール5選

Soraが死んだ。
2024年2月の華々しいデモから2年と少し。OpenAIは2026年3月24日、AI動画生成サービス「Sora」の終了を正式に発表した。アプリは4月26日に停止、APIも9月24日をもって完全に閉じる。ChatGPT内の動画生成機能も道連れだ。
世界中のクリエイターが「ついに来た」と熱狂したあの技術デモは、結局のところ、持続可能なプロダクトにはならなかった。
なぜSoraは潰れたのか
数字が全てを物語っている。Soraの推論コストは1日あたり推定1,500万ドル。10秒のクリップを1本生成するのに約1.3ドルかかる計算だ。対して、累計の売上はわずか210万ドル。ダウンロード数は2025年11月のピークから66%下落し、月間アクティブユーザーは50万人を割り込んでいた。
ディズニーとの10億ドル規模のライセンス契約も白紙に戻った。マーベル、ピクサー、スター・ウォーズのキャラクター200体以上をSoraで使えるようにするという野心的な提携だったが、契約締結からわずか3ヶ月で頓挫した。金は一銭も動いていない。
OpenAIの判断は冷徹だった。IPO準備が進む中で、GPUリソースをコーディングとエンタープライズ向けAI(次世代モデル「Spud」)に集中させる方が合理的だと結論づけた。動画生成は金食い虫で、しかもユーザーが離れていた。切るなら今しかない。
率直に言って、この撤退判断自体は正しいと思う。間違っていたのはタイミングではなく、そもそもの市場読みだ。「テキストから動画が作れる」というデモのインパクトに酔って、それがどれだけのコンピュートを食うのか、誰がいくら払うのかという基本的な問いを後回しにした。AI業界全体への教訓でもある。
Soraの穴を埋めるのは誰か
Soraが消えた今、AI動画生成市場は群雄割拠の状態にある。ここでは、筆者が実際に触って「これは使える」と判断した5つのツールを紹介する。それぞれ得意分野が異なるので、用途に合わせて選んでほしい。
1. Runway Gen-4.5 — プロ向け映像制作の本命
Runwayは2023年頃からAI動画の先頭を走ってきたが、Gen-4.5でそのリードをさらに広げた。Artificial Analysisのテキスト-to-ビデオベンチマークでElo 1,247を記録し、公開モデルの中でトップに立っている。
何が違うかというと、物理的なリアリズムだ。物体の重さ、慣性、液体の流れ、布のドレープ。Gen-4.5で生成した映像は「AIっぽい浮遊感」が明らかに減っている。髪の毛や布地のテクスチャが動きの中でも破綻しにくく、時間的な一貫性が保たれる。静止画を入力にした動画化にも対応しており、写真でもイラストでもスケッチでも、動きのある映像に変換できる。
ただし、コストは安くない。Gen-4.5は1秒あたり25クレジットを消費する。月額12ドルのStandardプランだと625クレジット、つまり25秒分しか生成できない。Proプラン(月28ドル)で90秒。映像をガンガン回すなら月76ドルのUnlimitedが視野に入るが、それでもExploreモードでの品質は落ちる。
筆者の評価としては、映像品質は文句なしにトップクラスだが、個人クリエイターが日常的に使うには価格設定が厳しい。制作会社やエージェンシーが本番映像に使う想定なら、十分にペイする品質ではある。
2. Kling 3.0 — 2分動画とカメラワークの自由度
中国・快手(Kuaishou)が開発するKlingは、3.0で一気に実用レベルに到達した。最大の武器は動画の長さだ。Soraが25秒程度で頭打ちだったのに対し、Kling 3.0は最大2分の動画を生成できる。
カメラ制御が異常に細かい。パン、ティルト、ズーム、ドリー、ラックフォーカスといった映画用語をプロンプトに直接書ける。マルチショットモードでは最大6カットを1つの動画内に配置でき、カット割りやショットリバースショットのトランジションを自動で処理してくれる。
出力は1080pと4K対応、30fps。ネイティブのオーディオ同期(台詞、効果音、BGM)も搭載し、16bit HDRやEXRシーケンスでの書き出しに対応している。NukeやAfter Effects、DaVinci Resolveにそのまま持ち込めるのは、ポストプロダクションのワークフローを考えると大きい。
物理シミュレーションも力を入れていて、重力、バランス、変形、衝突、慣性のシミュレーションを内蔵している。Omni Oneという独自アーキテクチャがこれを支えている。
懸念点を挙げるなら、中国製ツールであることのリスクだ。データの取り扱いについて不安を感じるユーザーは一定数いるだろうし、地政学的な状況次第でアクセスが制限される可能性もゼロではない。実際、TikTok関連で米国では政治的な圧力が続いている。ツールの品質とは無関係な次元で、使い続けられるかどうかの不確実性がある。
3. Pika 2.5 — SNS動画とエフェクト特化
Pikaは「映画品質」を追わず、SNS向けの短尺動画とクリエイティブエフェクトに振り切った戦略を取っている。その判断は正しいと思う。
Pika 2.5の特徴は、全解像度で1080p対応、最大25秒のクリップ生成、そしてPikaffectsと呼ばれるエフェクト群だ。Cake-ify(ケーキ化)、Crumble(崩壊)、Explode(爆発)、Melt(溶解)、Inflate(膨張)、Levitate(浮遊)など、物理的に不可能な変形を被写体に適用できる。TikTokやReelsで「何これ」と目を止めさせるための道具としては、他のどのツールよりも直感的で速い。
テンポラルコンシステンシー(時間的一貫性)も大幅に改善されており、以前のバージョンで悩まされた「チラつき」はほぼ消えた。Pikaformanceというリップシンク機能も搭載されている。
ただし、長尺の映像制作や映画品質のアウトプットを求めるなら、Pikaは選択肢に入らない。あくまで「短く、速く、面白く」がコンセプトだ。これを弱点と見るか、明確なポジショニングと見るかは、使い手次第だろう。
4. Google Veo 3.1 — 物理シミュレーションとアクセシビリティ
GoogleのVeo 3.1は、物理シミュレーションの精度で群を抜いている。水の流れ、影の落ち方、人間の動作。MovieGenBenchの物理サブセットでは、他モデルの出力と比較して最もリアルという評価を得ている。
Veoが他と一線を画しているのは、アクセシビリティだ。Google Vidsを通じて、Googleアカウントさえあれば無料で使える。APIもVertex AI経由で公開されており、Veo 3.1 Liteという軽量版は低コストで高速な生成を実現している。プロンプトの忠実度も高い。
次世代のVeo 3.2では「Artemis」エンジンと呼ばれるワールドモデルが導入される見込みで、ピクセル予測ではなく実世界の物理をシミュレートするアプローチに移行するとリークされている。30秒のネイティブ生成にも対応予定だ。
懸念は、Googleのプロダクトであるという事実そのものだ。GoogleにはサービスやAPIを突然終了させてきた長い歴史がある。Google Reader、Stadia、そして数えきれないほどの「Google Graveyard」の住人たち。Veoが同じ運命を辿らない保証はどこにもない。特にSoraの終了を目の当たりにした直後だけに、「大手が出しているから安心」とは言い切れない空気がある。
5. Seedance 2.0 — ダークホースの急浮上
ByteDanceのSeedance 2.0は、2026年3月のリリース直後にArtificial AnalysisでElo 1,269を叩き出し、Veo 3、Sora 2、Runway Gen-4.5をすべて上回った。ベンチマーク上の数字だけで言えば、現時点で最強だ。
最大の特徴は入力の柔軟性にある。テキスト、画像(最大9枚)、動画(最大3本)、音声(最大3本)を同時に入力でき、1回の生成パスで最大15秒・1080pの動画を出力する。「ディレクターのワークスペース」というコンセプトで、複数のリファレンスから一発でイメージを形にできる。
CapCutとの統合も進んでおり、2026年3月からはCapCut内で直接Seedance 2.0にアクセスできるようになった。TikTokのエコシステムとの接続は、クリエイターにとっての導線を強くしている。
ただし、著作権関連の問題がすでに噴出している。リリース直後、実在の俳優を使ったリアルな動画がSNSで拡散され、ハリウッドから猛反発を受けた。ByteDanceは実在の顔を使った動画生成をブロックし、C2PA電子透かしを導入するなど対策を講じたが、「まず出してから問題に対処する」姿勢への批判は根強い。米国ではTikTokと同様に政治的な圧力もかかっている。
ツールとしてのポテンシャルは高いが、使い続けられるかどうかは地政学と規制次第という、Klingと同じ構造的リスクを抱えている。
2026年のAI動画は何が変わったのか
Soraが登場した2024年、AI動画生成は「数秒のぼやけたクリップが出る」程度の技術だった。2年後の今、各ツールが到達している水準を並べると、進化の速度に改めて驚く。
解像度は1080pが標準、4K対応も始まっている。動画の長さは15秒から2分。ネイティブのオーディオ同期が当たり前になり、物理シミュレーションは水や布の挙動を高い精度で再現する。カメラワークの制御、マルチショット生成、HDR出力。これらは2年前には存在しなかった機能だ。
そしてもうひとつの変化は、市場構造そのものだ。Soraのような「一強」が生まれる前に競争が激化し、各社が得意分野で差別化するエコシステムが形成されつつある。映画品質ならRunway、長尺とカメラ制御ならKling、SNSエフェクトならPika、物理リアリズムならVeo、総合力ならSeedance。用途に合わせてツールを使い分ける時代が来ている。
結局、何を選べばいいのか
万能なツールは存在しない。これが正直な結論だ。
映像制作のプロなら、Runway Gen-4.5をメインに据えつつ、長尺が必要な場面でKling 3.0を併用するのが現実的だろう。SNSクリエイターならPika 2.5で十分事足りる場面が多い。コストを抑えたいなら、まずはGoogle Veo 3.1の無料枠を試すのが合理的だ。
ひとつ確実に言えるのは、Soraの死は終わりではなく、始まりだということだ。OpenAIが「儲からない」と判断して撤退した市場で、これだけの競争が起きている。AI動画生成の技術は止まらないし、コストも下がり続ける。Soraが残した最大の遺産は、テクノロジーではなく、「テキストから動画を作る」という概念を世界に刻みつけたことだったのかもしれない。
参考リンク
関連記事
Kling 3.0 vs Seedance 2.0 — ベンチマーク「1位」が2つある理由と、AI動画生成の現在地
!Kling 3.0(/images/posts/kling-3-ai-video.jpg) AI動画生成ツールの王座争いが激化している。先週Seedance 2.0を紹介した(/posts/seedance-2-bytedance-video)ばかりだが、Kling 3.0がまた状況を変えた。 厄介なのは、どち
Runway Gen-4.5レビュー — 1本430円のAI動画は、どこまで実用に耐えるか
!Runway Gen-4.5(/images/posts/runway-gen-4-5-ai-video.png) Soraが停止し、AI動画生成の勢力図が書き換わりつつある中で、Runwayが「世界最高の動画モデル」を掲げてリリースしたのがGen-4.5だ。 先代のGen-4が「一貫性のある動画」を実現したモ
a16z「Top 100 Gen AIアプリ」第6版を読み解く — ChatGPT 9億人、AI市場の勢力図はこうなっている
!a16z Top 100(/images/posts/a16z-top100-genai-apps-2026.png) 半年ごとにAI業界の勢力図を可視化するa16z(Andreessen Horowitz)のレポート「Top 100 Gen AI Consumer Apps」。その第6版が2026年3月に公開さ