Google AI Edge Eloquent — 無料・オフライン・Gemma搭載の音声入力アプリは本当に「使える」のか
Googleが新しいアプリをひっそりとリリースした。プレスリリースも、Googleブログの告知も、CEOのXポストもなし。2026年4月6日、App Storeに静かに現れた「Google AI Edge Eloquent」は、誰にも気づかれないまま公開された。
翌7日にTechCrunchや9to5Googleが取り上げて、ようやく話題になった。筆者もその報道で知り、すぐにインストールしてみた。結論から言うと、「荒削りだが、これは面白い」というのが率直な感想だ。
「話すだけで文章になる」体験
一言で言えば、オフラインで動く無料の音声入力アプリだ。ただし、単なる文字起こしツールではない。
スマートフォンに向かって話しかけると、リアルタイムで文字起こしが始まる。ここまでは他の音声入力と同じだが、Eloquentの面白さはその先にある。録音をポーズすると、AIが「えー」「あの」「そのー」といったフィラー(言いよどみ)を自動で除去し、文章として読める形に整えてくれる。サブスクリプション不要、使用量の上限なし。iPhoneで、完全に無料。
自分で試してわかったのだが、この「フィラー除去」は想像以上に快適だ。録音した自分の音声を後で聞き直して、「えー」の多さにうんざりした経験がある人は少なくないだろう。Eloquentはその「えー」をなかったことにして、きれいな文章として出力する。議事メモやアイデアの書き出しに使うと、音声入力のハードルがぐっと下がる感覚がある。
機能の全体像
特筆すべきは処理がすべてデバイス上で完結する点だ。設定からオンにできる「完全オフラインモード」では、音声データが一切サーバーに送られない。Googleは App Store の説明で「your audio, confidential conversations, and personal data never leave your device」と明言している。エンジンはGoogleのオープンモデル「Gemma」ベースのASR(自動音声認識)モデルで、初回ダウンロード後はネットワーク接続なしで動作する。
音声入力後には4つのテキスト変換オプションが表示される。「Key points」で要点を箇条書き化、「Formal」でビジネス文章に変換、「Short」で要約、「Long」で内容を膨らませる。これらのオプションはオフラインでも動作するが、クラウドモードに切り替えるとGeminiモデルがテキスト変換を処理し、より高い精度で整形してくれる。オフラインの手軽さとクラウドの精度、状況に応じて使い分けられるのは良い設計だと感じた。
カスタム語彙のインポート機能もある。Gmailアカウントと連携するか手動入力することで、固有名詞や専門用語を登録できる。業界用語が多い仕事をしている人にとっては、認識精度を上げるうえで重要な機能だ。
微妙な点も正直に
ただし、手放しで絶賛できるわけではない。
まず、対応言語が英語のみという制約がある。日本語で使いたいユーザーにとっては現時点で選択肢に入らない。さらに、イギリス、スイス、EU圏では利用できないという地域制限もあり、グローバル展開はまだ限定的だ。
機能面でも、タイムスタンプ出力や話者分離(スピーカーダイアライゼーション)には対応していない。会議の議事録を複数人の発言として記録したい場合や、長い録音の特定箇所を探したい場合には力不足だ。あくまで「自分の声をきれいな文章にする」ことに特化したアプリであり、本格的な文字起こしツールとは用途が異なる。
App Storeでの評価は4.6/5と高めだが、リリース直後の評価は母数が少ないため参考程度に見ておいた方がいいだろう。
Android版はどこに?
面白いのは、App Storeのアプリ説明にはAndroid版への言及があり、一時はEloquentの公式サイトに「Download for Android」ボタンまで表示されていたことだ。Android版ではシステムワイドのキーボード置き換えやフローティングボタンからの起動にも対応すると記載されていた。だがそのボタンはすぐに消え、現時点でAndroid版は登場していない。
GoogleがiOS専用でアプリを先行リリースするのはやや異例だ。自社プラットフォームをあとまわしにした形になっており、理由は公式には説明されていない。Android版の具体的なリリース時期も未定のままだ。Androidユーザーとしてはもどかしい状況だろう。
競合との比較 — 無料で戦えるのか
音声入力アプリの市場にはすでに多くの選択肢がある。Apple純正の音声入力、OpenAIのWhisperモデルをベースにしたアプリ群、そしてSuperWhisper(年額84.99ドル / 買い切り249ドル)やWispr Flow(月額15ドル)といった有料サービスだ。
SuperWhisperは100以上の言語に対応し、Mac・Windows・iOSで動作する。Wispr Flowも同様にマルチプラットフォーム対応で、高精度なテキスト整形を売りにしている。機能の幅だけを見れば、Eloquentがこれらに勝てる要素は少ない。
ではEloquentの強みは何か。「無料・オフライン・Google製」の三拍子だ。有料アプリに月額15ドルを払い続けるのは、ヘビーユーザーでなければ割に合わない。Eloquentは初期コストゼロで、しかもプライバシーを完全に守れる。この「気軽に試せて、データも外に出ない」という組み合わせは、他のアプリでは意外と実現できていない。
医療メモや法務メモなど、音声データをクラウドに送りたくない場面。インターネット接続が不安定な出先。あるいはシンプルに、サブスクリプション疲れを感じている人。そうした層にとって、Eloquentの存在意義は明確だ。
「AI Edge」というブランドが示す未来
「Google AI Edge」というブランド名は、Googleが以前からエッジAI開発に使っているフレームワーク群と同じルーツを持つ。LiteRTやMediaPipeといったオンデバイス推論技術の流れを汲んでおり、Eloquentはその技術を一般ユーザー向けに包んだ実験的プロダクトと見ていい。
ここで注目したいのは、Eloquentが「Gemmaがスマートフォン上でここまで使える」ことの生きたデモンストレーションだという点だ。Gemmaはオープンモデルとして公開されているが、エンドユーザーが直接触れる機会はまだ限られている。Eloquentを通じて「オープンモデルでもこれだけ実用的な体験が作れる」とGoogleが示すことには、開発者コミュニティへの大きなメッセージが込められている。
今後、同じ「AI Edge」ブランドで翻訳やリアルタイム要約など、別のオンデバイスAIアプリが登場する可能性も十分にある。Eloquentはその先駆けであり、Googleのエッジ AI戦略の試金石だ。
結局、誰のためのアプリか
Eloquentは万能ではない。英語限定、iOS限定、話者分離なし。現時点では機能的に物足りない部分が多い。だが、「英語で考えをさっとテキスト化したい」「データを外に出したくない」「無料がいい」という条件が揃うなら、試して損はない 🎙
個人的には、言語対応が広がったときに本当の勝負が始まると思っている。日本語対応が実現すれば、国内でも一気に注目されるだろう。それまでは、英語圏のユーザーにとっての「隠れた良アプリ」という位置づけが続きそうだ。
関連記事
Googleの音声AI、1時間のナレーションが約180円 — Gemini 3.1 Flash TTSの実力と死角
Gemini 3.1 Flash TTSは200以上のタグで声の感情やペースを制御できるGoogleの音声合成モデル。料金、ElevenLabsとの違い、日本語対応の実態を整理する。
スマホの中のAIが4倍速くなる日 — Androidに降りてきたGemma 4とGemini Nano 4
GoogleがGemma 4ベースのGemini Nano 4をAndroid AICore Developer Previewで公開。4倍速・電力60%減・140言語対応のオンデバイスAIで何が実現できるか、開発者向け要点をまとめる。
Google AI Edge Gallery — スマホでGemma 4をオフライン実行する時代が来た
Google AI Edge GalleryでGemma 4をスマホ完全オフライン実行した実機レビュー。AIチャット・画像質問・音声書き起こし・Agent Skillsの4機能、動作環境、プライバシーの強みと課題を解説