FlowTune Media

設計9ヶ月でテープアウト — OpenAI初の自社チップ「Jalapeño」は何が違うのか

OpenAIが半導体に手を出した。

6月24日、OpenAIはBroadcomと共同開発したAI推論チップ「Jalapeño」を発表した。OpenAI初のカスタムシリコンで、LLM推論に特化した設計。設計からテープアウト(製造開始前の最終段階)まで、わずか9ヶ月で到達した。高性能AI半導体としては最速級のASIC開発サイクルだという。

なぜ自社チップなのか

答えは単純で、推論コストが重すぎるからだ。

OpenAIはChatGPTだけで数億人のユーザーを抱えている。その推論処理のほとんどはNVIDIAのGPU上で動いている。NVIDIAのGPUは汎用的で優秀だが、その分コストも高い。推論のたびにNVIDIAに支払うコストは、OpenAIの事業構造にとって最大級の固定費だ。

GoogleはTPUを自社開発している。AmazonはTrainium/Inferentiaを持っている。MetaはMTIAを進めている。AIのフロンティアを走る企業がカスタムシリコンに向かうのは、もはや「やるかやらないか」ではなく「いつやるか」の問題だった。

OpenAIにとって、その「いつ」が来た。

推論専用という割り切り

Jalapeñoの設計思想ははっきりしている。推論だけをやる。

訓練用のチップではない。汎用のAIアクセラレータでもない。LLMの推論、特にOpenAIが自社で運用しているモデルの推論に最適化した専用設計だ。GPT-5.3-Codex-Sparkがすでにラボで動いている。

OpenAIは自社モデルのアーキテクチャ、カーネル、サービングシステム、ロードマップを完全に把握している。その知見をシリコンレベルで反映できるのが自社チップの強みだ。汎用チップメーカーには真似できない、ソフトウェアとハードウェアの垂直統合だ。

公式の表現を借りれば「コストのかかるデータ移動、計算とメモリのバランス、ネットワーキング効率」に特化した設計になっている。具体的な数値は非公開だが、ワットあたりの性能が現行のトップクラスを上回るとしている。

AIがAIチップを設計した

Jalapeñoの開発で面白いのは、設計プロセス自体にOpenAIのモデルが使われた点だ。

従来のASIC設計は2〜3年かかることが珍しくない。それが9ヶ月で完了した理由のひとつが、設計の一部をAIで加速したことだ。チップを作るAIが、チップの設計を手伝っている。少し不思議な構図だが、実利的には大きな意味がある。設計サイクルが短ければ、市場の変化に素早く対応できる。

Broadcomのシリコン実装の専門性と、OpenAIのモデル知見。この組み合わせが9ヶ月という異例の速度を可能にした。

デプロイ計画

Jalapeñoは2026年末からデプロイが始まる。Microsoftのギガワット級データセンターを含むインフラに展開され、その後数年かけて拡大していく計画だ。「マルチジェネレーション」のコンピュートプラットフォームの第一世代という位置づけで、後継チップも予定されている。

2029年までに完全展開を目指すスケジュールだが、この手のハードウェアプロジェクトは遅延がつきもの。実際にどれだけのスケールで稼働するかは、今後の進捗を見る必要がある。

これが意味すること

Jalapeñoが1チップとして成功するかどうかは、正直まだわからない。ワットあたり性能の具体数値は非公開だし、実際のコスト削減効果も見えていない。

だが、OpenAIが「NVIDIAの顧客」から「自前のシリコンを持つフルスタックAI企業」に踏み出したという事実は大きい。ChatGPTの推論コストが下がれば、無料プランの拡充やAPI料金の値下げに直結する可能性がある。

ユーザーにとってすぐに何かが変わるわけではないが、「AIの利用コストが構造的に下がる」方向に動いている。GoogleのTPUがGeminiの安さを支えているように、Jalapeñoが成熟すればOpenAIのサービスもコスト面で競争力を増すだろう。

AI企業が自前のチップを持つ。ソフトウェア企業だったはずの会社が、半導体設計にまで手を広げる。AI産業がそこまで巨大になったということだ。

関連記事