FlowTune Media

「この動画を60秒にまとめて」で本当にまとまる — ブラウザ完結のAI動画エディタCardboard

30分のポッドキャスト収録から「60秒のハイライトリール」を作る。マーケティングチームなら週に何本もこなす作業だが、Premiere ProやDaVinci Resolveを開いて手作業で切り貼りすると、1本あたり30分〜1時間は消える。

Cardboardはその作業を「テキストで指示して、数十秒で初稿を受け取る」に変えようとしているツールだ。Y Combinator W26バッチに採択され、Hacker NewsのShow HNでバッチ内最高投票数を記録した。

動画を「生成」しない、という設計判断

Cardboardの名前を聞いて「また動画生成AIか」と思った人がいるかもしれないが、アプローチがまったく違う。

RunwayやKlingのようなAI動画生成ツールはプロンプトからピクセルを生成する。Cardboardはそうではなく、ユーザーが持ち込んだ実際の映像素材に対して、編集操作を自動化する。タイムラインの構成——どこで切るか、どのショットを使うか、音楽とどう合わせるか——をAIが判断して初稿を作り、人間がそこから調整する。

「make a 60s recap from this raw footage」と入力すれば、AIが素材を分析し、ハイライトを抽出し、テンポを整えたタイムラインを返す。生成された動画ではなく、あくまで実際の素材を使った編集結果だ。

この違いは大きい。生成AIの動画はまだ「AIっぽさ」が抜けないが、実際の撮影素材をベースにした編集なら、出来上がりはそのまま本番で使える。

ブラウザだけで完結する理由

技術的に面白いのは、Cardboardがブラウザ上で完全に動作する点だ。

WebCodecsとWebGL2という比較的新しいWeb APIを使い、映像のデコード・エンコードからレンダリングまでをクライアントサイドで処理する。サーバーに映像をアップロードしてレンダリングを待つ、という従来のクラウド動画編集の弱点がない。

正直、「ブラウザで動画編集」と聞くと動作がモッサリしそうだが、WebCodecsはGPUのハードウェアデコーダを直接叩けるため、ネイティブアプリに近いパフォーマンスが出る。少なくとも技術的な筋は通っている。

プラグインのインストールも不要で、URLを開けばすぐに使える。チーム内のレビュー・フィードバックもブラウザ上で完結するため、「プロジェクトファイルをエクスポートして共有」という手間がない。

テキスト指示の先にある編集機能

自然言語での指示がコア機能だが、その周辺も手厚い。

「beat sync to the music」と打てば音楽のパーカッションを検出してカットを自動配置する。「add captions in Japanese」で多言語字幕が付く。この字幕はフレーム内の被写体を認識し、人物に重ならない位置に自動配置される「空間認識型」で、CapCutの字幕機能より一歩先を行く。

タイムラインはマルチトラック対応で、キーフレームアニメーションも使える。AIの初稿に手動で微調整を加えたいときに、「AIが作ったから手出しできない」とはならない。

音声面では、ボイスオーバー生成とボイスクローニングに対応している。素材映像にナレーションを重ねたいとき、自分の声を録り直す必要がない。

そしてPremiere Pro、DaVinci Resolve、Final Cut ProへのXMLエクスポートに対応している点は見逃せない。Cardboardで粗編集し、仕上げはプロツールで——この使い方ができるから、「ブラウザの動画エディタ」という制約が実務上ほとんど問題にならない。

料金

Entryプランが月額60ドル(約9,200円)。5つのアクティブプロジェクト、2.5GBのファイルサイズ上限、100GBのクラウドストレージ、自動キャプション、無制限エクスポートが含まれる。

Proプランは月額150ドル(約23,000円)で、チーム向けに設計されている。

無料のデモがdemo.usecardboard.comで公開されており、ログイン不要で試せる。

「量産」に強く、「表現」には弱い

Cardboardが最も力を発揮するのは、量産型の動画編集だ。ポッドキャストのクリップ、プロダクトの紹介動画、トーキングヘッドの編集、SNS向けショート動画。素材があって、そこから要点を切り出して、テンポよくまとめる——この手の作業なら、手作業の数分の一の時間で初稿が出る。

一方、ブランドの世界観を反映したモーションデザイン、フレーム単位の色補正、複雑なVFXといった作業には向いていない。AIが得意なのは「編集判断」であって「表現の追求」ではない。そういった仕上げ作業はXMLエクスポートでPremiere ProやDaVinciに渡すのが現実的だ。

筆者の所感

率直に言って、Cardboardの面白さは「AIの賢さ」よりも「ブラウザ完結」と「XMLエクスポート」の組み合わせにある。

AIによる粗編集の精度は、まだ人間が「ここでカットすべきだ」と思うポイントと一致しないことがある。特に文脈依存の判断——話の流れ的にここは残すべき、ここは冗長——はまだ改善の余地がある。

だが、初稿を一瞬で出せる価値は、精度の不完全さを補って余りある。「0からタイムラインを組む」のと「AIの初稿を直す」のでは、心理的なハードルも作業時間もまったく違う。さらに、仕上げが必要ならXMLでプロツールに渡せるので、ワークフローの入口として機能する。

YC W26のスタートアップなので機能はまだ成熟途上だが、「動画編集のCopilot」というポジションは明確で、CapCutやCanvaの自動編集とは異なるプロ寄りの市場を狙っている。

動画マーケティングの量産体制を組みたいチームにとって、月60ドルで試す価値はある。

関連記事