Sora消滅の4月、Pika 2.5が「速さ」で勝負に出た — Scene Extensionの実力と限界
4月26日、OpenAIのSoraが終わる。
あれだけ期待された「AI動画のiPhone」は、高すぎるコンピュート費用と50万人以下に落ち込んだアクティブユーザー、そしてDisney案件の破談を経て、ローンチからわずか半年で幕を閉じることになった。
だが市場は止まらない。Soraの撤退を横目に、Kling 3.0、Runway Gen-4.5、Seedance 2.0、そしてPikaが着々とポジションを固めている。中でもPika 2.5は、「最速のAI動画生成」という明確な旗を掲げて勝負に出た。
Scene Extension — 「続き」を生成する技術
Pika 2.5の目玉は、Scene Extension(シーン延長)だ。
通常のAI動画生成は、プロンプトから数秒のクリップを生成して終わる。Scene Extensionは、生成された最終フレームをコンテキストとして次のクリップを生成する。キャラクターの位置、ライティング、カメラアングル、環境ディテールが引き継がれるため、理論上は15秒まで一貫性のある映像を積み重ねられる。
これが実用的なのは、SNSのショート動画制作だ。TikTokやReelsの尺は15〜60秒。従来のAI動画ツールは3〜5秒のクリップを量産してつなぎ合わせるしかなく、つなぎ目の不自然さが課題だった。Scene Extensionはそのつなぎ目を消す。
ただし万能ではない。延長を重ねるほどに細部が崩れる傾向はあるし、15秒の一貫性を謳っていても、実際には10秒あたりからキャラクターの顔の細部やテクスチャにブレが出始める。「完璧な15秒」ではなく「実用的な10秒」と思っておくのが正直なところだ。
Layered Motion Control
もうひとつの新機能がLayered Motion Control(多層モーション制御)だ。
カメラワークをDolly(前後移動)、Orbit(対象の周囲を回転)、Static(固定)から選べるのに加え、背景要素(雲、水面、木々)を被写体とは独立して動かせる。風でなびく髪の毛は動いているのに背景はゆっくりパンする、といった映像表現が、プロンプトの指定だけで可能になる。
Motion Brushも搭載されており、画面上のどの部分を動かすかをペイントで指定できる。「この人物の右手だけ動かしたい」といった細かい制御が効く。
料金と他ツールの比較
Soraが消える2026年4月、主要なAI動画ツールの立ち位置を整理する。
| ツール | 月額 | 強み | 弱み |
|---|---|---|---|
| Pika 2.5 | $8〜 | 生成速度、SNS向けエフェクト | 1080pで細部が甘い |
| Kling 3.0 | $6.99〜 | 最長2分、コスパ最強 | エフェクトの自由度 |
| Runway Gen-4.5 | $15〜 | 映画的表現、後編集(Aleph) | 価格が高い |
| Seedance 2.0 | 要確認 | キャラ同一性(Identity Lock) | 生態系が狭い |
| Google Veo 3.1 | 無料枠あり | ネイティブ音声同期 | 細かい制御が弱い |
Pikaの立ち位置は「速くて安いSNS特化型」だ。2分間ありでRunwayの半額で済むが、シネマティックな表現や長尺ではKlingやRunwayに軍配が上がる。
生成速度はPikaの最大の強み。Flowith Blogのテストによれば、Runway/Kling比で3〜5倍速く結果が出る。TikTokのために毎日何本もクリップを量産するクリエイターには、この速度差が累積的に効いてくる。
1080pの現実
Pika 2.5は1080p出力に対応している。が、現実には720pのほうが安定する。
1080pでは細かいテキスト、複雑なテクスチャ、顔のディテールにアーティファクトが残りやすい。SNS用途(スマホ画面で視聴)なら気にならないレベルだが、大画面での視聴や商業利用には注意が要る。上位プランほどクレジット消費が重くなるため、720pで十分な場面は720pを選ぶのが賢い。
4K対応はまだない。
Sora以後のAI動画市場
Soraの終了は、AI動画業界にとってネガティブなニュースではない。むしろ「ひとつの大きな実験が終わり、市場が成熟に向かう」転換点だ。
Soraが証明したのは、最高品質のAI動画を無制限に提供するビジネスモデルは成立しない、ということ。残ったプレイヤーたちは、それぞれの戦略で持続可能な路線を模索している。Klingは圧倒的なコスパ、Runwayは映画制作者向けの高品質パイプライン、Seedanceはキャラ一貫性、VeoはGoogle生態系との統合。
Pikaが選んだのは「速さ × SNS」という路線だ。物理エフェクト(溶ける、潰れる、膨らむ)に特化した遊び心のある表現は、バイラルコンテンツとの相性が良い。車がチョコレートのように溶ける映像や、ロゴが風船のように弾ける映像は、SNSの「最初の1秒で止まらせる」要件にぴったりだ。
関連記事
PikaStream 1.0 — AIの「自分」がGoogle Meetに出席する時代、$0.275/分の代理出席は何を変えるか
Pika LabsのPikaStream 1.0は、AIアバターがあなたの代わりにGoogle Meetに参加するリアルタイム動画モデル。仕組み、料金、倫理的な問題点を解説する。
daVinci-MagiHuman — 2秒でリップシンク動画を生成。有料ツールに勝率80%のOSSが来た
daVinci-MagiHumanは15BパラメータのOSSモデル。Apache 2.0で商用利用OK、日本語対応、HeyGen等の有料ツールに人間評価で勝率80%。使い方と限界を解説。
HeyGen Avatar V — 15秒の自撮りから「もう一人の自分」を作る。identity driftを克服した第5世代モデルの技術と使いどころ
HeyGenのAvatar Vは15秒の録画からフォトリアルなデジタルツインを生成するAIアバターモデル。175言語リップシンク、identity drift解消の仕組み、料金を解説。