FlowTune Media

$20Bでチップ技術をNVIDIAに売った会社が、$650Mで「第二の人生」を始める — Groqネオクラウドの賭け

自社でチップを設計し、NVIDIAに真っ向から挑む——それがGroqの物語だった。独自のLPU(Language Processing Unit)で圧倒的な推論速度を見せつけ、AI開発者の間では「Groqで動かすと速い」が合言葉になっていた。

その物語が、2025年12月に一変した。

NVIDIAとの200億ドル(約3兆円)のライセンス契約。GroqのLPU技術はNVIDIAの手に渡り、上級幹部の多くもNVIDIAに移籍した。2026年2月には株主に76億ドル(約1.1兆円、1株あたり約64ドル)が分配されている。事実上の「非買収」——会社は残ったが、中身は大きく入れ替わった。

そして5月29日。残ったチームが次の一手を打った。6.5億ドル(約975億円)の資金調達で、「Groq2」として再出発する。

チップ屋からクラウド屋へ

Groq2のCEOに就いたAdam Winterが掲げたのは、「ネオクラウド」という聞き慣れない言葉だ。(TechCrunch報道より)

ネオクラウドとは、AWS・Azure・GCPのような汎用クラウドではなく、AI推論に特化した軽量なクラウドサービスのことだ。学習(トレーニング)ではなく、推論(インファレンス)——つまり、すでに訓練されたAIモデルをリアルタイムで動かす部分だけに集中する。

ここに、ある種の皮肉がある。かつてNVIDIAのGPUに対抗するためにLPUを作ったGroqが、今度はNVIDIAのハードウェアの上でサービスを提供する側に回るのだ。

なぜ推論に張るのか

AIの世界では長らく「学習」が主戦場だった。巨大なGPUクラスターで数ヶ月かけてモデルを訓練する、その計算量が勝負を決めていた。

しかし2026年現在、市場の重心が変わりつつある。モデルの数が増え、APIで推論を提供するサービスが爆発的に成長しているからだ。学習は一度きりだが、推論は24時間365日、ユーザーがリクエストするたびに走る。トークン数で見れば、推論の方がはるかに大きな市場だ。

ByteDanceのVolcano Engineが2026年4月時点で1日あたり120兆トークンを処理しているという数字を考えれば、推論インフラの需要がどれほど膨大か想像がつく。

Groq2はここに狙いを定めた。レイテンシ(応答遅延)に敏感なリアルタイム推論——音声エージェント、対話型AI、ゲームのNPCなど——を主戦場とする。

残されたカード

正直に言えば、このピボットにはリスクがある。

まず競争相手が強い。推論クラウドの領域では、AWS、Azure、GCPという巨人がいるだけでなく、CoreWeave、Lambda、Fluidstackといった「ネオクラウド」先行組もすでにポジションを築いている。Groq2が後発で入る余地は限られる。

次に、技術的な独自性の問題。LPUはNVIDIAに渡した。NVIDIAはGTC 2026で「Groq 3」チップ——ライセンス契約から生まれた最初のチップ——を披露している。Groq2の手元に残ったのは、LPUを使いこなしてきたオペレーションのノウハウと、推論ワークロードの最適化技術だ。これがどこまで差別化要因になるかは未知数だ。

一方で、既存投資家のDisruptiveとInfinitumが6.5億ドルの全額をカバーする用意があるという点は、チームへの信頼の表れとも読める。「技術は売ったが、技術を動かす腕前は残っている」という見立てだ。

チップスタートアップの生存戦略

Groqの軌跡は、AI半導体スタートアップの現実を映し出している。

チップの設計から製造まで一気通貫でやるには、数十億ドル規模の投資と数年の開発期間が要る。そしてNVIDIAという圧倒的な先行者がいる。CerebrasはIPOを選び、GraphcoreはSoftBankに吸収され、Groqは技術をNVIDIAにライセンスした。「NVIDIAに挑む」という看板で始まったスタートアップたちが、それぞれ異なる着地点を探している。

Groq2の「NVIDIA製ハードウェアの上で推論サービスを提供する」という選択は、敗北ではなく現実主義だと筆者は見ている。チップで勝てないなら、チップの上のレイヤーで勝負する。AWS上でサービスを提供するスタートアップが「AWSに負けた」とは言われないのと同じ理屈だ。

ただ、そのレイヤーで本当に勝てるかは別の問題だ。NVIDIAのハードウェアは誰でも買える。Groq2の6.5億ドルは、競合と同じハードウェアを使いながら、ソフトウェアとオペレーションだけで差をつけなければならない。

LPU時代のように「ハードウェアが違うから速い」という分かりやすい訴求は、もう使えない。

なお、現在GroqCloudでLPUベースの推論APIを利用しているユーザーへの影響は、今のところ発表されていない。Groq2への移行がどう進むか、既存APIの継続性がどうなるかは、続報を待つ必要がある。

関連記事