FlowTune Media

マイケル・ケインの声で13時間 — AI生成のオーディオブックがElevenReaderで無料公開

マイケル・ケインが13時間分のオーディオブックを朗読した。

ただし、スタジオには一度も入っていない。声の主は、ケイン本人の許諾のもとにクローンされたAI音声だ。

ElevenLabsが6月に公開した『オデッセイ』は、ホメロスの叙事詩をAI技術だけで13時間のシネマティック・オーディオブックに仕上げたプロジェクトだ。ナレーション、キャラクターの声(20以上)、BGM、効果音。すべてがAI生成で、人間が担当したのはプロデュースとディレクションだけ。4人のプロデューサーが6週間で完成させた。

ElevenReaderアプリで無料公開されている。

なぜ『オデッセイ』なのか

タイミングは偶然ではない。クリストファー・ノーラン監督の映画『The Odyssey』の公開が控えている。ノーラン作品の常連であるマイケル・ケインの声を使ったAIオーディオブックは、映画を観る前に原作を「聴いて」予習するための入口として設計されている。

マーケティング的に巧みだが、それだけではない。ElevenLabsがこのプロジェクトで示したかったのは「AI音声技術がどこまで来たか」の実証だ。13時間という長尺を、93歳の名優の声で、感情の起伏を保ちながら一貫して読み上げる。これは短いデモ動画では伝わらない種類の説得力がある。

何がAI生成なのか

すべてだ。

マイケル・ケインのナレーション音声はElevenLabsの音声クローン技術で生成されている。あの独特のコックニー訛りとハスキーな声質が再現されている。20以上のキャラクター音声は、ElevenLabsのボイスライブラリから選ばれたAI音声だ。

BGMと効果音はElevenLabsのミュージックジェネレーターで生成。嵐の海、オリュンポスの神殿、セイレーンの歌声といった場面ごとの音響が、朗読に合わせて動的に変化する。

人間がやったのは、テキストの選定、各シーンの演出方針の決定、生成された音声のチェックと調整。つまり「監督」と「プロデュース」だ。

出版業界への問い

このプロジェクトは、オーディオブック市場に静かな衝撃を与えている。

従来、プロのナレーターが13時間分を収録するには数週間のスタジオワークが必要だった。コストは数百万円規模になることも珍しくない。それが4人×6週間で、しかも多言語吹き替えまで含めて完成している。

Audibleで人気のオーディオブックは1冊20〜30ドルで販売されている。ElevenLabsはこれを無料で公開した。技術デモとしての戦略的判断だが、「AIオーディオブックは無料で作れる」という前例を作ったことになる。

出版社はどう動くだろうか。ナレーターの仕事が奪われるという懸念は当然ある。一方で、これまでオーディオブック化されなかった絶版書や学術書が、低コストで音声化される可能性も開けた。光と影の両方がある。

素直にすごいと思った点

13時間という長さを聴き通して感じるのは、AI音声の「一貫性」だ。人間のナレーターは体調や疲労で声の調子が変わるが、AI音声にはそれがない。13時間の最初と最後で、ケインの声のトーンがぶれない。

効果音との同期も自然だ。波の音が朗読の間合いに合わせて引いたり、戦闘シーンで音楽のテンションが上がったりと、「ただ読んでいるだけ」ではない演出が施されている。

気になる点

AI音声の一貫性は長所だが、裏を返すと「人間的な揺らぎ」がない。感動的なシーンで声が震えたり、ユーモラスなセリフで微妙にニヤついたりする、あの人間ならではの味わいは薄い。「すごく上手い朗読」ではあるが、「心に残る朗読」になるかは聴く人次第だろう。

また、マイケル・ケインの同意を得ているとはいえ、「故人の声を使ったAIオーディオブック」が今後登場する可能性を考えると、倫理面の議論はまだ続くことになる。

ElevenReaderで聴ける

ElevenReaderのアプリから無料で全編を聴ける。アカウント登録は必要だが、課金は不要だ。英語版のみ。

ノーラン映画の予習として聴くもよし、AI音声技術の現在地を確認するために聴くもよし。13時間のうち最初の30分だけでも、AI音声がどこまで来たかがわかる。

関連記事