FlowTune Media

ElevenLabsのAPI料金が最大55%下がった — 従量課金も導入、音声AIの敷居がまた一段低くなる

1,000文字の音声合成にかかるコストが、$0.11から$0.05になった。半額以下だ。

ElevenLabsが5月にAPI料金の大幅値下げを実施した。テキスト読み上げ(TTS)は最大55%、音声認識(STT)は最大45%、音声エージェントは最大20%のコスト削減。同時に、月額プランに縛られないPay-as-You-Go(従量課金)も導入された。

$500M ARRを達成し、$11Bの評価額でシリーズDを完了したばかりのタイミングでのこの値下げ。規模の経済が効き始めた、ということだろう。

何がどれだけ安くなったのか

値下げの恩恵がもっとも大きいのはFlashモデルだ。

Flashモデル(低レイテンシ向け)は、Creatorプランで1,000トークンあたり$0.05。値下げ前の$0.11から55%の削減になる。Multilingual v2やv3といった高品質モデルは1,000トークンあたり$0.10前後で、こちらも値下げされている。

音声認識(STT)のScribe v1/v2は1時間あたり$0.22。エンティティ検出を追加すると$0.07/時間、キーワードプロンプティングで$0.05/時間が上乗せされる。

音声エージェントの料金は、モデルティアによって$0.08〜$0.12/分。Standardが$0.08/分、Turboが$0.10/分、Premium(GPT-4o + Flash v2.5音声)が$0.12/分だ。

日本円に換算すると(1ドル=約155円として)、Flashモデルで1,000文字の音声合成が約7.8円。日本語のブログ記事1本(3,000文字)をまるごと音声化しても24円程度で済む計算だ。

従量課金(PAYG)で何が変わるか

もう一つの大きな変更が、Pay-as-You-Go(PAYG)の導入だ。

これまでElevenLabsを開発に組み込むには、月額プラン(Starterの$5/月〜)への加入が前提だった。プロトタイプ段階で月額を払い続けるのは地味にストレスだし、利用量が読めないうちは「どのプランを選べばいいのかわからない」という問題もあった。

PAYGはこの摩擦を取り除く。使った分だけ請求される従量課金なので、プロトタイプから本番まで一貫して同じ料金体系で運用できる。月額プランのように「今月のクレジットが余った」「足りなくなった」というギャップが生じない。

ただし、PAYG単体の場合はプランの月額クレジットによる割引が効かないため、安定した利用量がある場合は月額プランのほうがコスト効率は良い。ここは用途に応じた使い分けが必要だ。

この値下げで現実的になるユースケース

55%の値下げは「ちょっと安くなった」というレベルではない。コスト構造が変わることで、これまで採算が合わなかったユースケースが成立し始める。

たとえば、ポッドキャスト自動生成。1エピソード30分の音声を毎週生成するケースを考えると、値下げ前は月間コストが無視できない金額になっていた。55%の削減はこうした「量の多い」用途に直接効く。

音声エージェントの分野でも、$0.08/分のStandardティアなら、1通話5分で約$0.40(約62円)。カスタマーサポートの一次対応や予約受付のような反復的なタスクに音声AIを使う場合、人件費との比較で現実的な選択肢になる。

もっとニッチな話をすると、個人開発者がアプリに音声合成を組み込むハードルも下がった。PAYGなら初期費用ゼロで始められるし、Flashモデルの低レイテンシ×低コストは、チャットボットの音声応答やゲームのNPCボイスのような用途にちょうどいい。

競合との立ち位置

音声AI市場では、Google Cloud TTSやAmazon Polly、Microsoft Azure Speech Servicesがエンタープライズ向けの定番だ。価格面ではこれらも十分に安いが、ElevenLabsが選ばれる理由は「声の自然さ」にある。特にEleven v3モデルの感情表現は、現時点で競合を一歩リードしている。

オープンソース陣営ではVoxCPM2やCoqui TTSのような選択肢もあるが、品質と運用の手軽さでElevenLabsのAPIは依然として強い。値下げによって「品質は欲しいがコストが気になる」という層を取り込みにきた格好だ。

一方で気になるのは、プラン体系の複雑さだ。Free、Starter、Creator、Pro、Scale、Business、Enterpriseの7段階に、PAYGが加わった。選択肢が多いのはいいが、「自分に合うプランはどれか」がますますわかりにくくなった感は否めない。

値下げの裏にある戦略

ElevenLabsが値下げに踏み切れるのは、規模が支えているからだ。2025年末の$350M ARRから4ヶ月で$500Mに伸び、ユーザーベースは拡大を続けている。ユーザーが増えればインフラの単位コストが下がり、それを価格に反映できる。

加えて、音声エージェント市場への投資がある。ElevenLabsは音声合成の会社から「音声AIプラットフォーム」への転換を進めており、エージェント料金を下げることで、このプラットフォームへのロックインを深めようとしている。

音声AIを使った開発を検討しているなら、このタイミングでPAYGから試してみるのが合理的だ。月額の縛りなしに最新モデルの品質を検証でき、本番に移行するときには月額プランに切り替えてコストを最適化すればいい。

関連記事