FlowTune Media

Claude Codeに「動画作って」と頼んだら、本当にナレーション付きで返ってきた — OpenMontageの仕組み

AI動画生成ツールは山ほどある。RunwayもKlingもVeoも使った。でもどれも「素材」を生成するだけで、「完成品」——台本があり、ナレーションがあり、字幕がつき、カットが切り替わる動画——を作ってくれるツールはなかった。

OpenMontageは、その空白を埋めにきたOSSだ。GitHub 23,600スター、Trending 1位。やっていることはシンプルで、Claude CodeやCursor、Copilotといったコーディングアシスタントを「動画制作スタジオ」に変える。

コーディングアシスタントが動画を作る、とは

OpenMontageの発想は、よく考えると理にかなっている。

Claude CodeやCursorはもともと「ツールを呼び出して作業する」能力を持っている。コードを書く代わりに、動画生成API(Runway、Veo、HeyGen)を呼び、音声合成API(ElevenLabs、Piper)を呼び、字幕を焼き、BGMを足し、最後にffmpegで1本の動画にまとめる——このワークフローを、500以上のエージェントスキルとして定義したのがOpenMontageだ。

具体的には12のパイプラインが用意されている。

リサーチ → 台本作成 → 素材収集 → 画像生成 → 動画生成 → ナレーション → 字幕 → BGM → アバター → 編集 → レンダリング → 書き出し。映像制作チームが踏む工程を、そのままエージェントのタスクに変換した格好だ。

APIキーなしでも動く

正直に言うと、「52ツール対応」と聞いたときは、どうせ全部有料APIの羅列だろうと思った。

ところが実際には、無料のローカルTTS(Piper)とフリー素材サービス(Pexels、Pixabay)だけで動画を生成するパイプラインが用意されている。APIキーもクレジットカードも要らない。

もちろんクオリティは上がらない。Piperの音声は機械的だし、Pexelsのストック映像は汎用的だ。しかし「社内向けの説明動画」「ブログ記事の要約動画」「プロトタイプのデモ映像」くらいなら、これで十分なケースがある。

有料APIを使えば質は一気に上がる。Runway Gen-4.5で映像を生成し、ElevenLabsでプロ品質のナレーションを付け、HeyGenでアバターを被せる——といった組み合わせが、Claude Codeへの1回の指示で完結する。

使ってみて感じたこと

筆者がClaude Codeと組み合わせて触った限り、良い点と微妙な点がはっきり分かれた。

良い点は「ワークフローの自動化」だ。動画制作で最も面倒なのは、ツール間の受け渡し。台本はGoogleドキュメント、映像はRunway、音声はElevenLabs、編集はPremiere……とアプリを行き来する手間が消える。Claude Codeに「このブログ記事をもとに2分の解説動画を作って」と頼むだけで、工程を勝手に踏んでくれる。

微妙な点は「細かい調整が効きにくい」こと。動画の特定のカットのタイミングを変えたい、ナレーションのこの部分だけトーンを変えたい——こうした微調整は、結局手作業になる。「80%の完成度まで自動で持っていき、残り20%を人間が仕上げる」というのが現実的な使い方だろう。

何が変わるのか

OpenMontageが面白いのは、「動画生成AI」ではなく「動画制作のオーケストレーション」を担っている点だ。

RunwayやKlingはパーツ(映像クリップ)を生み出す。OpenMontageはそのパーツを組み合わせて完成品を仕上げる。どちらかの「代替」ではなく、レイヤーが違う。

これが意味するのは、コーディングアシスタントが「コード以外の制作物」を扱えるようになった、ということだ。Claude Codeでマーケティング動画を量産する。CursorでYouTubeチャンネルの動画を自動生成する。AIコーディングツールのユーザー層がそのまま動画制作者になる——そういう未来が、23,000スターのOSSから静かに始まっている。

始め方

Claude CodeまたはCursorが動く環境であれば、リポジトリをクローンしてMCPサーバーとして接続するだけだ。セットアップ手順はGitHubのREADMEに詳しい。Python 3.10以上、ffmpegが必要。

APIキーなしで始めて、必要に応じてRunwayやElevenLabsのキーを追加する——という段階的な導入ができるのは、地味だが大きな利点だ。

関連記事