$20Bでチップ技術をNVIDIAに売った会社が、$650Mで「第二の人生」を始める — Groqネオクラウドの賭け
自社でチップを設計し、NVIDIAに真っ向から挑む——それがGroqの物語だった。独自のLPU(Language Processing Unit)で圧倒的な推論速度を見せつけ、AI開発者の間では「Groqで動かすと速い」が合言葉になっていた。
その物語が、2025年12月に一変した。
NVIDIAとの200億ドル(約3兆円)のライセンス契約。GroqのLPU技術はNVIDIAの手に渡り、上級幹部の多くもNVIDIAに移籍した。2026年2月には株主に76億ドル(約1.1兆円、1株あたり約64ドル)が分配されている。事実上の「非買収」——会社は残ったが、中身は大きく入れ替わった。
そして5月29日。残ったチームが次の一手を打った。6.5億ドル(約975億円)の資金調達で、「Groq2」として再出発する。
チップ屋からクラウド屋へ
Groq2のCEOに就いたAdam Winterが掲げたのは、「ネオクラウド」という聞き慣れない言葉だ。(TechCrunch報道より)
ネオクラウドとは、AWS・Azure・GCPのような汎用クラウドではなく、AI推論に特化した軽量なクラウドサービスのことだ。学習(トレーニング)ではなく、推論(インファレンス)——つまり、すでに訓練されたAIモデルをリアルタイムで動かす部分だけに集中する。
ここに、ある種の皮肉がある。かつてNVIDIAのGPUに対抗するためにLPUを作ったGroqが、今度はNVIDIAのハードウェアの上でサービスを提供する側に回るのだ。
なぜ推論に張るのか
AIの世界では長らく「学習」が主戦場だった。巨大なGPUクラスターで数ヶ月かけてモデルを訓練する、その計算量が勝負を決めていた。
しかし2026年現在、市場の重心が変わりつつある。モデルの数が増え、APIで推論を提供するサービスが爆発的に成長しているからだ。学習は一度きりだが、推論は24時間365日、ユーザーがリクエストするたびに走る。トークン数で見れば、推論の方がはるかに大きな市場だ。
ByteDanceのVolcano Engineが2026年4月時点で1日あたり120兆トークンを処理しているという数字を考えれば、推論インフラの需要がどれほど膨大か想像がつく。
Groq2はここに狙いを定めた。レイテンシ(応答遅延)に敏感なリアルタイム推論——音声エージェント、対話型AI、ゲームのNPCなど——を主戦場とする。
残されたカード
正直に言えば、このピボットにはリスクがある。
まず競争相手が強い。推論クラウドの領域では、AWS、Azure、GCPという巨人がいるだけでなく、CoreWeave、Lambda、Fluidstackといった「ネオクラウド」先行組もすでにポジションを築いている。Groq2が後発で入る余地は限られる。
次に、技術的な独自性の問題。LPUはNVIDIAに渡した。NVIDIAはGTC 2026で「Groq 3」チップ——ライセンス契約から生まれた最初のチップ——を披露している。Groq2の手元に残ったのは、LPUを使いこなしてきたオペレーションのノウハウと、推論ワークロードの最適化技術だ。これがどこまで差別化要因になるかは未知数だ。
一方で、既存投資家のDisruptiveとInfinitumが6.5億ドルの全額をカバーする用意があるという点は、チームへの信頼の表れとも読める。「技術は売ったが、技術を動かす腕前は残っている」という見立てだ。
チップスタートアップの生存戦略
Groqの軌跡は、AI半導体スタートアップの現実を映し出している。
チップの設計から製造まで一気通貫でやるには、数十億ドル規模の投資と数年の開発期間が要る。そしてNVIDIAという圧倒的な先行者がいる。CerebrasはIPOを選び、GraphcoreはSoftBankに吸収され、Groqは技術をNVIDIAにライセンスした。「NVIDIAに挑む」という看板で始まったスタートアップたちが、それぞれ異なる着地点を探している。
Groq2の「NVIDIA製ハードウェアの上で推論サービスを提供する」という選択は、敗北ではなく現実主義だと筆者は見ている。チップで勝てないなら、チップの上のレイヤーで勝負する。AWS上でサービスを提供するスタートアップが「AWSに負けた」とは言われないのと同じ理屈だ。
ただ、そのレイヤーで本当に勝てるかは別の問題だ。NVIDIAのハードウェアは誰でも買える。Groq2の6.5億ドルは、競合と同じハードウェアを使いながら、ソフトウェアとオペレーションだけで差をつけなければならない。
LPU時代のように「ハードウェアが違うから速い」という分かりやすい訴求は、もう使えない。
なお、現在GroqCloudでLPUベースの推論APIを利用しているユーザーへの影響は、今のところ発表されていない。Groq2への移行がどう進むか、既存APIの継続性がどうなるかは、続報を待つ必要がある。
関連記事
1枚のチップが皿ほどの大きさ — NVIDIAに挑むAI半導体Cerebrasが上場申請、時価総額5.6兆円を狙う
Cerebras SystemsがNasdaq上場を申請。WSE-3チップの技術的優位性、OpenAI・AWS大型契約、売上5.1億ドルの成長実績とNVIDIA一強への挑戦を解説。
NVIDIAの次世代AI基盤「Vera Rubin」の中身 — 3360億トランジスタ、6チップ構成の意味
NVIDIAがGTC 2026で発表した次世代AI基盤Vera Rubinを解説。Rubin GPUの3360億トランジスタ・HBM4・50 PFLOPsの性能と、6チップ構成のフルスタック設計が何を変えるのかを整理する。
中国のAI推論チップが量産に入った — Ascend 950PRが崩しにかかっているもの
HuaweiのAscend 950PRが2026年4月量産開始。1.56 PFLOPS FP4性能でH20の約2.8倍、DeepSeek V4の主実行基盤、ByteDance/Alibaba/Tencentから計75万ユニットの発注。NVIDIA依存脱却の現実味を整理する。