Claude Codeに「動画作って」と頼んだら、本当にナレーション付きで返ってきた — OpenMontageの仕組み
AI動画生成ツールは山ほどある。RunwayもKlingもVeoも使った。でもどれも「素材」を生成するだけで、「完成品」——台本があり、ナレーションがあり、字幕がつき、カットが切り替わる動画——を作ってくれるツールはなかった。
OpenMontageは、その空白を埋めにきたOSSだ。GitHub 23,600スター、Trending 1位。やっていることはシンプルで、Claude CodeやCursor、Copilotといったコーディングアシスタントを「動画制作スタジオ」に変える。
コーディングアシスタントが動画を作る、とは
OpenMontageの発想は、よく考えると理にかなっている。
Claude CodeやCursorはもともと「ツールを呼び出して作業する」能力を持っている。コードを書く代わりに、動画生成API(Runway、Veo、HeyGen)を呼び、音声合成API(ElevenLabs、Piper)を呼び、字幕を焼き、BGMを足し、最後にffmpegで1本の動画にまとめる——このワークフローを、500以上のエージェントスキルとして定義したのがOpenMontageだ。
具体的には12のパイプラインが用意されている。
リサーチ → 台本作成 → 素材収集 → 画像生成 → 動画生成 → ナレーション → 字幕 → BGM → アバター → 編集 → レンダリング → 書き出し。映像制作チームが踏む工程を、そのままエージェントのタスクに変換した格好だ。
APIキーなしでも動く
正直に言うと、「52ツール対応」と聞いたときは、どうせ全部有料APIの羅列だろうと思った。
ところが実際には、無料のローカルTTS(Piper)とフリー素材サービス(Pexels、Pixabay)だけで動画を生成するパイプラインが用意されている。APIキーもクレジットカードも要らない。
もちろんクオリティは上がらない。Piperの音声は機械的だし、Pexelsのストック映像は汎用的だ。しかし「社内向けの説明動画」「ブログ記事の要約動画」「プロトタイプのデモ映像」くらいなら、これで十分なケースがある。
有料APIを使えば質は一気に上がる。Runway Gen-4.5で映像を生成し、ElevenLabsでプロ品質のナレーションを付け、HeyGenでアバターを被せる——といった組み合わせが、Claude Codeへの1回の指示で完結する。
使ってみて感じたこと
筆者がClaude Codeと組み合わせて触った限り、良い点と微妙な点がはっきり分かれた。
良い点は「ワークフローの自動化」だ。動画制作で最も面倒なのは、ツール間の受け渡し。台本はGoogleドキュメント、映像はRunway、音声はElevenLabs、編集はPremiere……とアプリを行き来する手間が消える。Claude Codeに「このブログ記事をもとに2分の解説動画を作って」と頼むだけで、工程を勝手に踏んでくれる。
微妙な点は「細かい調整が効きにくい」こと。動画の特定のカットのタイミングを変えたい、ナレーションのこの部分だけトーンを変えたい——こうした微調整は、結局手作業になる。「80%の完成度まで自動で持っていき、残り20%を人間が仕上げる」というのが現実的な使い方だろう。
何が変わるのか
OpenMontageが面白いのは、「動画生成AI」ではなく「動画制作のオーケストレーション」を担っている点だ。
RunwayやKlingはパーツ(映像クリップ)を生み出す。OpenMontageはそのパーツを組み合わせて完成品を仕上げる。どちらかの「代替」ではなく、レイヤーが違う。
これが意味するのは、コーディングアシスタントが「コード以外の制作物」を扱えるようになった、ということだ。Claude Codeでマーケティング動画を量産する。CursorでYouTubeチャンネルの動画を自動生成する。AIコーディングツールのユーザー層がそのまま動画制作者になる——そういう未来が、23,000スターのOSSから静かに始まっている。
始め方
Claude CodeまたはCursorが動く環境であれば、リポジトリをクローンしてMCPサーバーとして接続するだけだ。セットアップ手順はGitHubのREADMEに詳しい。Python 3.10以上、ffmpegが必要。
APIキーなしで始めて、必要に応じてRunwayやElevenLabsのキーを追加する——という段階的な導入ができるのは、地味だが大きな利点だ。
関連記事
AIの出力を「原始人語」に変えたら、トークン消費が65%減った — Cavemanの仕組みと実効性
Claude Codeの出力トークンを最大65%削減するスキル「Caveman」を解説。原始人モードの仕組み、4段階の圧縮レベル、実際の節約効果と限界を整理する。
大規模コードベースに放り込まれたときの「最初の1手」— Understand-Anythingが解決すること
Understand-Anythingはコードを知識グラフに変換するClaude Codeプラグイン。GitHub 5万スター超。インストール方法、主要コマンド、活用シーンを解説。
「AIデスクトップ」を自分で作る — OSSのWandeskがClaude CodeもCodexもまとめて1つの画面に載せた
Wandeskは無料のOSS AIデスクトップ。アプリ自動生成とClaude Code統合の仕組みを解説。