ElevenLabsのAPI料金が最大55%下がった — 従量課金も導入、音声AIの敷居がまた一段低くなる
ElevenLabsがTTS最大55%、STT最大45%、エージェント最大20%のAPI値下げとPAYG(従量課金)を発表。新旧料金の比較と、開発者への影響を解説。
10件の記事
ElevenLabsがTTS最大55%、STT最大45%、エージェント最大20%のAPI値下げとPAYG(従量課金)を発表。新旧料金の比較と、開発者への影響を解説。
OpenAIのGPT-Realtime-2、Realtime-Translate、Realtime-Whisperの3モデルを解説。GPT-5クラスの推論を持つ音声AIの料金・機能・競合比較。
Grok Custom Voices解説。1分の録音でボイスクローン、追加料金なし。ElevenLabsとの比較も。
2026年のAI音声合成(TTS)ツールを徹底比較。ElevenLabs、Gemini 3.1 Flash TTS、Grok TTS、Voxtral、VoxCPM2の料金・品質・日本語対応を整理し、用途別のおすすめを解説する。
ElevenLabsがAWSのエージェントIDE「Kiro」向けPowerを公開。TTS・STT・音楽・効果音APIをコーディング中に呼び出せる。動的コンテキストロードの仕組みと開発者への影響を解説。
xAIがGrok STT/TTS APIを公開。文字起こし$0.10/時間、音声合成$4.20/100万文字。ElevenLabsの10分の1以下の価格で精度は上回る。料金・性能・使い所を整理した。
Googleが4月15日にリリースしたGemini 3.1 Flash TTSを解説。200以上のオーディオタグで感情・声質・ペースを制御できるAI音声合成モデルの実力、料金、ElevenLabsとの違いを整理する。
ElevenLabs Eleven v3の機能・Audio Tags・料金・日本語性能を解説。感情表現できるTTSモデルの実力と、v2.5との使い分けを整理する。
VoxCPM2は30言語対応・商用無料のOSS音声合成モデル。声を文章で設計できるボイスデザイン機能の仕組みと使い方を解説。
Gemini 3.1 Flash TTSは200以上のタグで声の感情やペースを制御できるGoogleの音声合成モデル。料金、ElevenLabsとの違い、日本語対応の実態を整理する。