FlowTune Media

年商750億円の音声AI企業に、ハリウッドとウォール街が同時に賭けた — ElevenLabs ARR $500M突破の内幕

2025年9月に$200M。2025年末に$350M。そして2026年4月に$500M。

ElevenLabsの年間経常収益(ARR)が描くカーブは、「音声AI」というカテゴリがニッチではなくなったことを数字で証明している。日本円に換算すれば約750億円。創業からわずか3年半で、日本の上場SaaS企業の大半を追い抜いた計算になる。

ElevenLabs

新しい投資家リストが語ること

5月5日、ElevenLabsは2月に完了した$5億のシリーズD(評価額$110億)に追加で参加した投資家を公表した。

名前を並べると、意図が見えてくる。

金融勢: BlackRock、Wellington Management、D.E. Shaw、Schroders、Santander。世界最大の資産運用会社から欧州の老舗銀行まで。機関投資家がここまで揃うのは、IPOが視野に入っている証拠だろう。

テック勢: NVentures(NvidiaのVC部門)。ハードウェアとの連携を見据えた投資で、オンデバイス音声合成や低レイテンシ推論のためのGPU最適化が想定される。ElevenLabsがオンプレミス・オンデバイス展開を発表したのは、Nvidiaの参加と無関係ではないはずだ。

エンタメ勢: Jamie Foxx、Eva Longoria、『イカゲーム』のファン・ドンヒョク監督を含む30人以上の俳優・ミュージシャン・スポーツ選手。セレブが音声AIに投資するのは、自分の「声」が資産になる未来を見ているからだ。ElevenLabsのIconic Voices(同意ベースのセレブ音声マーケットプレイス)がまさにその受け皿になる。

さらに$1億の従業員株式売却も実施された。前回(2025年9月)からわずか8ヶ月。従業員への還元速度も異常だ。

なぜこのタイミングで$500Mなのか

ARRが$200Mから$500Mに跳ねた半年間を分析すると、3つのドライバーが浮かぶ。

1. エンタープライズの音声エージェント需要

カスタマーサポート、営業架電、採用面接。AIが電話口で人間のように話す場面は、2026年に入って急激に増えた。Deutsche Telekom、Revolut、Deliveroo。ElevenLabsのConversational AI機能を本番環境に投入する企業は、もはやアーリーアダプターではない。Retell AIのような音声エージェント専業プレイヤーも月5,000万コールまで伸びており、市場全体の拡大がElevenLabsを押し上げている。

2. 音声クローンの「怖い」から「便利」への転換

かつて懸念されていた声のクローン技術が、セレブ自身の投資対象になったのは象徴的だ。同意ベースで管理される限り、声は「コピーされるもの」ではなく「ライセンスされる資産」になる。ElevenLabsのEleven v3が実現した感情表現の精度が、「AIの声」の不気味さを大幅に減らしたことも大きい。

3. 音楽生成への領域拡大

ElevenMusicの投入で、「音声合成」から「音のプラットフォーム」へ軸が移った。BGM生成、効果音、ジングル。Sunoのような純粋な音楽AIとは異なり、ElevenLabsは音声・音楽・吹き替えを一つのプラットフォームで完結させようとしている。

Grokの音声API、GoogleのTTSという競争環境

ただし、楽観ばかりではない。

xAIのGrokが音声APIに参入し、ElevenLabsの10分の1の価格で提供を始めた。GoogleはGemini 3.1 Flash TTSで1時間180円という価格を実現している。MistralもSmall 4でオープンモデルの音声合成に参入した。

音声合成の「コモディティ化」は確実に進んでいる。ElevenLabsが$500M ARRを維持できるかは、単純なTTSではなくConversational AI(対話型音声エージェント)とコンテンツ制作(吹き替え・音楽)で差別化できるかにかかっている。

$500Mの先に見えるもの

機関投資家の参加と従業員株式売却の頻度を考えると、IPOは2026年後半から2027年前半と見るのが自然だ。Anthropicが6月にIPOを控え、SpaceXも上場に動く。AI企業の「上場ラッシュ」が始まる中で、ElevenLabsが音声AIのカテゴリリーダーとしてどのポジションを取るのか。

正直に言えば、「音声」は「テキスト」や「画像」に比べてAIの中では地味なカテゴリだと見られてきた。しかしARR $500Mという数字は、その認識が完全に間違っていたことを示している。AIエージェントが増えれば増えるほど、それに「声」を与える企業の価値は上がる。声は、AIが人間の世界に出てくるためのインターフェースだ。

関連記事