マイケル・ケインの声で13時間 — AI生成のオーディオブックがElevenReaderで無料公開
マイケル・ケインが13時間分のオーディオブックを朗読した。
ただし、スタジオには一度も入っていない。声の主は、ケイン本人の許諾のもとにクローンされたAI音声だ。
ElevenLabsが6月に公開した『オデッセイ』は、ホメロスの叙事詩をAI技術だけで13時間のシネマティック・オーディオブックに仕上げたプロジェクトだ。ナレーション、キャラクターの声(20以上)、BGM、効果音。すべてがAI生成で、人間が担当したのはプロデュースとディレクションだけ。4人のプロデューサーが6週間で完成させた。
ElevenReaderアプリで無料公開されている。
なぜ『オデッセイ』なのか
タイミングは偶然ではない。クリストファー・ノーラン監督の映画『The Odyssey』の公開が控えている。ノーラン作品の常連であるマイケル・ケインの声を使ったAIオーディオブックは、映画を観る前に原作を「聴いて」予習するための入口として設計されている。
マーケティング的に巧みだが、それだけではない。ElevenLabsがこのプロジェクトで示したかったのは「AI音声技術がどこまで来たか」の実証だ。13時間という長尺を、93歳の名優の声で、感情の起伏を保ちながら一貫して読み上げる。これは短いデモ動画では伝わらない種類の説得力がある。
何がAI生成なのか
すべてだ。
マイケル・ケインのナレーション音声はElevenLabsの音声クローン技術で生成されている。あの独特のコックニー訛りとハスキーな声質が再現されている。20以上のキャラクター音声は、ElevenLabsのボイスライブラリから選ばれたAI音声だ。
BGMと効果音はElevenLabsのミュージックジェネレーターで生成。嵐の海、オリュンポスの神殿、セイレーンの歌声といった場面ごとの音響が、朗読に合わせて動的に変化する。
人間がやったのは、テキストの選定、各シーンの演出方針の決定、生成された音声のチェックと調整。つまり「監督」と「プロデュース」だ。
出版業界への問い
このプロジェクトは、オーディオブック市場に静かな衝撃を与えている。
従来、プロのナレーターが13時間分を収録するには数週間のスタジオワークが必要だった。コストは数百万円規模になることも珍しくない。それが4人×6週間で、しかも多言語吹き替えまで含めて完成している。
Audibleで人気のオーディオブックは1冊20〜30ドルで販売されている。ElevenLabsはこれを無料で公開した。技術デモとしての戦略的判断だが、「AIオーディオブックは無料で作れる」という前例を作ったことになる。
出版社はどう動くだろうか。ナレーターの仕事が奪われるという懸念は当然ある。一方で、これまでオーディオブック化されなかった絶版書や学術書が、低コストで音声化される可能性も開けた。光と影の両方がある。
素直にすごいと思った点
13時間という長さを聴き通して感じるのは、AI音声の「一貫性」だ。人間のナレーターは体調や疲労で声の調子が変わるが、AI音声にはそれがない。13時間の最初と最後で、ケインの声のトーンがぶれない。
効果音との同期も自然だ。波の音が朗読の間合いに合わせて引いたり、戦闘シーンで音楽のテンションが上がったりと、「ただ読んでいるだけ」ではない演出が施されている。
気になる点
AI音声の一貫性は長所だが、裏を返すと「人間的な揺らぎ」がない。感動的なシーンで声が震えたり、ユーモラスなセリフで微妙にニヤついたりする、あの人間ならではの味わいは薄い。「すごく上手い朗読」ではあるが、「心に残る朗読」になるかは聴く人次第だろう。
また、マイケル・ケインの同意を得ているとはいえ、「故人の声を使ったAIオーディオブック」が今後登場する可能性を考えると、倫理面の議論はまだ続くことになる。
ElevenReaderで聴ける
ElevenReaderのアプリから無料で全編を聴ける。アカウント登録は必要だが、課金は不要だ。英語版のみ。
ノーラン映画の予習として聴くもよし、AI音声技術の現在地を確認するために聴くもよし。13時間のうち最初の30分だけでも、AI音声がどこまで来たかがわかる。
関連記事
無料で5冊までオーディオブック化 — SpotifyがElevenLabsのAI音声で出版の敷居を下げた
SpotifyにElevenLabsのAI音声でオーディオブック作成機能追加。無料5冊まで。使い方を解説。
ElevenLabsが動画生成に踏み込んだ — Avatars機能と3部門再編が意味すること
ElevenLabsがAvatars機能で動画アバター生成に参入。ElevenAgents・Creative・APIの3部門体制と旧モデル廃止の影響を解説。
ElevenLabsのAPI料金が最大55%下がった — 従量課金も導入、音声AIの敷居がまた一段低くなる
ElevenLabsがTTS最大55%、STT最大45%、エージェント最大20%のAPI値下げとPAYG(従量課金)を発表。新旧料金の比較と、開発者への影響を解説。