無料で5冊までオーディオブック化 — SpotifyがElevenLabsのAI音声で出版の敷居を下げた
本を書いたことがある人なら、オーディオブック化のハードルの高さを知っているだろう。プロのナレーターに依頼すれば数十万円。自分で録音するなら数十時間。
その壁が崩れ始めた。
Spotify for Authorsに、ElevenLabsのAI音声合成技術を使ったオーディオブック作成機能が追加された。原稿をアップロードすれば、AIが自然な音声で全編を読み上げてくれる。無料枠で最大5冊まで。6月からベータが始まっている。
どう使うのか
手順はシンプルだ。
- ElevenLabsのStudioに原稿ファイル(.epub、.pdf、.txt、.html、.docx)をアップロード
- 声を選び、読み上げのペースやイントネーションを調整
- 全編のナレーションを生成
- 完成したファイルをSpotify for Authors(旧Findaway Voices)にアップロード
- 審査を経てSpotifyで公開
対応言語は29言語。日本語も含まれている。
ここで重要なのは、非独占契約であること。Spotifyで公開したオーディオブックは、Amazon Audibleやその他のプラットフォームでも同時に販売できる。これは地味に大きい。プラットフォームにロックインされない自由は、個人出版の生命線だ。
料金
無料枠で英語のオーディオブックを5冊まで作成できる。6冊目以降やプレミアム音声の利用は有料になるが、具体的な価格はまだ発表されていない。
ElevenLabs単体で見ると、月額$5のStarterプランで30分の音声生成、月額$22のCreatorプランで100分が使える。10万字程度の書籍をフルで読み上げると5〜7時間程度になるため、書籍単位で考えるとCreatorプラン以上が現実的だろう。
ただし、Spotify for Authors経由のベータでは独自の枠が提供されるため、ElevenLabsの通常プラン料金がそのまま適用されるかは不明だ。
誰に刺さるのか
最も恩恵を受けるのは、既にKindleやnoteで電子書籍を出している個人著者だ。
テキストはあるのにオーディオブック化できなかった人にとって、これは新しい販路の追加を意味する。Spotifyのオーディオブック事業は年間売上1億ドル(約150億円)規模に成長しており、「聴く読書」の市場は確実に広がっている。
技術書やビジネス書の著者にとっても面白い。自分の本をポッドキャスト感覚でSpotifyに置けるようになる。書籍のプロモーション手段として、オーディオブック版を無料公開するという使い方もあり得る。
一方で、小説や文芸作品の著者には慎重な判断が必要だ。AI音声のナレーションは技術的に高品質だが、登場人物の感情表現や声の使い分けには限界がある。「AIが読んだ」というラベルが付くことへの抵抗感も、ジャンルによっては無視できないだろう。
ElevenLabsの音声品質
筆者がElevenLabsを触った範囲では、英語の読み上げ品質はかなり高い。プロのナレーターと聞き比べないとわからないレベルに近づいている。
日本語はどうか。正直、英語ほどの自然さには達していない。漢字の読み間違いや、文脈に合わないアクセントがまだ散見される。ただし、ノンフィクションや技術書のような「情報伝達が主目的」のコンテンツであれば、十分に実用的なレベルだ。
全編をAI音声で通すのに抵抗がある場合は、一部の章だけをサンプルとして生成し、残りはプロに依頼する — というハイブリッドな使い方もできる。
透明性への配慮
SpotifyはAIナレーションのオーディオブックに「narrated by a digital voice(デジタル音声によるナレーション)」というラベルを必ず表示する。これは正しい判断だと思う。
読者(聴者)が「これはAIの声だ」と知った上で購入・再生できる環境は、信頼性の担保として必要だ。いずれAI音声と人間の声の区別がつかなくなる時代が来るとしても、その過渡期に透明性を保つことは重要だろう。
「聴く」市場の広がり
この機能が面白いのは、SpotifyがElevenLabsという外部のAI音声技術を正式に組み込んだ点だ。
Spotifyは既に「パーソナルポッドキャスト」(AIが個人向けにニュースを読み上げる機能)を展開している。ElevenLabsとの連携を深めれば、ユーザーが好きな声でポッドキャストやオーディオブックを生成する世界も見えてくる。「著者本人の声をクローンしてナレーション」という機能は、技術的にはElevenLabsが既に提供しているものだ。
出版社の視点では、バックカタログのオーディオブック化が低コストで可能になる。絶版になった書籍をAI音声でオーディオブックとして復活させるという動きは、すでに海外の一部出版社で始まっている。
原稿がある人は、まずは1冊だけ試してみるのがいい。無料で5冊まで作れるうちに、自分のコンテンツがオーディオブックとして成立するかを確かめられる。
関連記事
ElevenLabsのAPI料金が最大55%下がった — 従量課金も導入、音声AIの敷居がまた一段低くなる
ElevenLabsがTTS最大55%、STT最大45%、エージェント最大20%のAPI値下げとPAYG(従量課金)を発表。新旧料金の比較と、開発者への影響を解説。
1秒未満で返答するAI音声 — Grok Voiceが250万以上の音声エージェントのデフォルトに
xAIのGrok VoiceがVapiの12種デフォルト音声に採用。TTFA 1秒未満・$0.05/分・100言語以上対応の音声AIが、250万超のエージェントを動かす。
OpenAIの音声AIが「考えてから話す」ようになった — GPT-Realtime-2と3モデル体制の全容
OpenAIのGPT-Realtime-2、Realtime-Translate、Realtime-Whisperの3モデルを解説。GPT-5クラスの推論を持つ音声AIの料金・機能・競合比較。