Grok 4.3、Claude Opusの12分の1の価格で1Mコンテキスト — さらに声もコピーする

5月1日、xAIがGrok 4.3のAPIアクセスを全面開放した。前モデルGrok 4.20から入力トークン価格を約40%引き下げ、$1.25/100万トークン（出力$2.50）。Claude Opus 4.7が$15/100万トークンだから、ざっくり12分の1の計算になる。

Grok 4.3

価格だけなら「安かろう悪かろう」で片付けられる。だが今回は同時に3つの機能を載せてきた。1Mトークンのコンテキストウィンドウ、ネイティブ動画入力、そしてCustom Voices（音声クローニング）。この3点セットが$1.25というのは、率直に言って攻撃的な価格設定だ。

「常時推論」が標準になった

Grok 4.3は、全クエリでreasoning（思考プロセス）が動作する設計になっている。o1やClaude Opusのように「考えさせたいときだけ推論モードをオンにする」のではなく、推論が常にアクティブ。

Artificial Analysis Intelligence Indexでの評価コストは$395で、Grok 4.20比で約20%安い。スコアは上がってコストは下がった。性能面ではClaude Opus 4.7に届かないものの、「推論込みの性能を低価格で大量に使いたい」用途では現状最もコスパが良い。

動画を直接食わせる

Grok 4.3でネイティブ動画入力に対応した。これまでは「スクリーンショットを撮ってからLLMに投げる」という手順が必要だったが、動画ファイルをそのまま渡せる。

製品デモの分析、ユーザーテストの録画レビュー、YouTube動画の要約。1M コンテキストと組み合わせれば、30分程度の動画なら丸ごと投入できる計算だ。

60秒の録音で自分の声をコピーする

4月30日に発表されたCustom Voicesが、4.3と同時に利用可能になった。xAIコンソールで60秒ほど喋るだけで、本人確認を経て数分以内にカスタム音声が生成される。

安全面は2段階認証を採用している。まず指定フレーズの読み上げをSTTで照合し、次に話者埋め込み（speaker embedding）で同一人物かを確認。他人の声を勝手にクローンできない仕組みだ。

生成された音声は、笑い声やため息、ささやきといった感情表現タグにも対応する。多言語出力も可能で、REST/WebSocketストリーミングにも対応。料金は追加なし — 通常のTTSと同じ$4.20/100万文字で使える。

正直、この「追加料金なし」が一番驚いた。ElevenLabsの音声クローンは上位プランが必要だし、OpenAIはまだ一般向けに開放していない。

何が実現できるか

Grok 4.3の「安い推論 × 動画理解 × 音声クローン」の組み合わせで、いくつか面白い使い方が見えてくる。

たとえば、社内研修動画を投げて議事録を生成し、それを自分の声で音声コンテンツに変換する。一連の作業がGrok API一本で完結する。外部サービスを3つ繋ぐ必要がなくなる。

あるいは、YouTubeの解説動画を動画入力で要約し、その内容をポッドキャスト風に自分の声で読み上げるパイプライン。個人クリエイターがワンストップで多チャンネル展開できる。

もっと実務寄りなら、カスタマーサポートの通話録音（動画 or 音声）をGrok 4.3に投げて品質分析し、改善提案をブランドの音声で社内共有する。$1.25/Mトークンなら、数百件の通話を毎日処理しても月額は数十ドルで済む。

微妙な点

「常時推論」の裏返しとして、単純な質問でもthinkingトークンを消費する。「今日の天気は？」レベルのクエリにも推論が走るため、軽量用途では他モデルのほうが効率的な場合がある。

また、Artificial Analysis Intelligence Indexのスコア自体はClaude Opus 4.7やGPT-5.4の下に位置する。「安いから妥協する」ポジションであることは変わらない。コスト制約がない環境なら、精度重視でClaude Opusを選ぶべきだろう。

音声クローニングについては、60秒の録音で生成できる手軽さの反面、話者の癖やイントネーションの再現精度には個人差がある。公式が「production-ready」と謳う品質は確保されているが、プロのナレーション代替にはまだ距離がある印象だ。

競合との料金・機能比較

項目	Grok 4.3	Claude Opus 4.7	GPT-5.4
入力価格	$1.25/M	$15/M	$2.50/M
出力価格	$2.50/M	$75/M	$10/M
コンテキスト	1M	1M	128K
動画入力	✅	❌	✅
音声クローン	✅	❌	❌
常時推論	✅	オン/オフ	オン/オフ

xAIの戦略は明確だ。「最高精度」ではなく「十分な精度を圧倒的に安く、大量に」。エージェント開発やバッチ処理のように、大量のトークンを消費するユースケースに刺さる価格設定になっている。

Grok 4.3の詳細はxAI公式サイトで確認できる。

Grok 4.3、Claude Opusの12分の1の価格で1Mコンテキスト — さらに声もコピーする

「常時推論」が標準になった

動画を直接食わせる

60秒の録音で自分の声をコピーする

何が実現できるか

微妙な点

競合との料金・機能比較

関連記事

Grok、1分の録音で自分の声をクローンできるようになった — Custom Voices API

Xが暗号化メッセンジャーを出した — 広告なし・電話番号不要、ただしGrokに話した内容は暗号化されない

フォローしていない話題が勝手に届く——Xの「カスタムタイムライン」はGrok AIでどう動くのか