ノートPCで1200億パラメータのAIを動かす — NVIDIA RTX Sparkが変えるローカルAIの前提
120Bパラメータの大規模言語モデルを、100万トークンのコンテキストで、ノートPCの上で動かす。1年前ならジョークだった話が、NVIDIAの新チップで現実になろうとしている。
2026年5月31日、NVIDIAはComputex 2026でRTX Sparkを発表した。WindowsノートPCやコンパクトデスクトップ向けのSoC(System on Chip)で、AIの推論・コーディング・映像編集・ゲーミングを1つのチップに集約する。Microsoftとの協業でWindows OSとの統合が深く、2026年秋に主要メーカーから搭載PCが登場する予定だ。
何が載っているのか
RTX Sparkの構成はシンプルだが強力だ。
Armアーキテクチャの20コアCPUと、Blackwell世代のRTX GPU(6,144 CUDAコア)を1チップに統合している。両者はNVIDIA独自のインターコネクト「NVLink-C2C」で接続され、600GB/sの帯域でデータをやり取りする。最大128GBの統合メモリ(LPDDR5X)を共有するため、CPUとGPUの間でデータをコピーする無駄がない。
AI性能は1ペタフロップ。数字だけだとピンとこないが、これは120Bパラメータのモデルを100万トークンのコンテキストでローカル実行できるスペックだ。DeepSeek-V4-FlashクラスのモデルをノートPC上で走らせられる計算になる。
クラウドに頼らないAIの使い方
スペックだけ聞いても「だからどうした」となりがちだが、ローカルで大規模モデルを動かせることの意味は大きい。
まず、プライバシーの壁がなくなる。社内の機密コードや顧客データをクラウドに送らずにAIに処理させたい企業は多い。RTX Sparkなら、そうしたデータをローカルのLLMに食わせて分析・生成ができる。APIの利用規約やデータ処理条項を気にしなくていい。
次に、レイテンシの問題が消える。クラウドへのリクエストに伴う数百ミリ秒のラウンドトリップがゼロになる。コーディングエージェントをローカルで動かすなら、この差は体感で効いてくる。
NVIDIAはこのチップに「OpenShell」というセキュリティフレームワークを組み込んでいる。AIエージェントをローカルで安全に実行するための仕組みで、Microsoftと共同開発したものだ。つまりRTX Sparkは単なるAIチップではなく、PCをエージェント実行環境に変えるプラットフォームとして設計されている。
映像・3D・ゲームもこなす
AIだけでなく、クリエイティブワークロードもカバーしている。
具体的には、90GB超の3Dシーンのレンダリング、12K 4:2:2映像の編集、4K AIビデオの生成が可能。ゲーマー向けには1440p解像度で100fps以上のAAAタイトルプレイを謳っている。
正直に言うと、これまでNVIDIAのモバイル向けチップは「デスクトップの廉価版」という位置づけだった。RTX Sparkはその構図を変えようとしている。Arm CPUとの統合によって電力効率を上げつつ、128GBの統合メモリで「ノートPCだからメモリが足りない」という泣き所を解消した。
Apple M4 Ultra、Qualcommとの勢力図
ここで気になるのが競合との比較だ。
AppleはM4 Ultraで192GBの統合メモリを搭載し、ローカルLLM実行に強い基盤を持っている。ただしApple SiliconはNVIDIA CUDAに対応せず、AIフレームワークの互換性ではNVIDIA側に分がある。CUDAエコシステムの広さは、短期的には大きなアドバンテージだ。
QualcommのSnapdragon X Eliteも省電力のAI推論に強いが、GPU性能ではRTX Sparkに及ばない。特にAI推論と映像処理を同時にこなすマルチワークロードでは、128GBメモリと600GB/s帯域の差が出る。
もっとも、RTX SparkはArm版Windows上で動く。x86アプリとの互換性はエミュレーション頼みになる。ここは現時点で最大の不確定要素だろう。Surface Pro 12sやASUS ProArt P16のようなArm搭載WindowsマシンでNeural Processingが主体となる使い方なら問題ないが、従来のx86ソフトを多用するユーザーにとっては移行コストが発生する。
発売予定と搭載PC
ASUS、Dell、HP、Lenovo、Microsoft Surface、MSIがRTX Spark搭載のノートPCおよびコンパクトデスクトップを2026年秋に発売する。AcerとGIGABYTEも追って投入予定。
価格は未発表だが、128GBメモリ搭載のプレミアムノートPCとなると20万円台後半から30万円台になると見込まれる。安くはない。だが、ローカルでのAI実行を本気で考えるユーザーにとっては、クラウドAPI費用との天秤で十分に検討に値する。
これが意味すること
RTX Sparkの本質は「PC上で完結するAI」の性能閾値を引き上げたことにある。
これまでローカルLLMの実行は7B〜13Bクラスが現実的で、それ以上は品質とのトレードオフを受け入れる必要があった。120Bクラスがノートで動くなら、クラウドのAPIを叩く以外の選択肢が実用レベルで存在することになる。
Claude CodeやCursorのようなAIコーディングツールも、将来的にローカルモデルを推論バックエンドとして使えるようになれば、月額課金なしで動く開発環境が成立するかもしれない。もちろんフロンティアモデルの品質には届かないが、「手元で完結する安心感」と「レイテンシの短さ」は、ユースケースによってはクラウドよりも価値がある。
秋の発売までに、対応するソフトウェアスタックがどこまで整うかが鍵だ。チップの性能だけでは意味がない。NVIDIA RTX Spark公式ページで最新の対応状況を追っておくのがいいだろう。
関連記事
AIエージェントが「自分で検索する」時代のAPI — MicrosoftがBingの上に作ったWeb IQの中身
Microsoft Web IQはAIエージェント向けの検索グラウンディングAPI。Bing基盤で164ms応答、MCP対応。ChatGPTとCopilotを裏で支える仕組みと、開発者にとっての意味を解説する。
機密ファイルはPC上で処理、複雑な推論はクラウドへ — Perplexityが自動で振り分ける
PerplexityがComputex 2026でIntelと発表したハイブリッド推論オーケストレーター。AIがタスクごとにローカル/クラウドを自動判断。7月搭載予定の仕組みと制約を解説。
「AIにPCを操作させる」がクラウド不要に — オープンソースのHolo3.1が12GB GPUで動く
Holo3.1はDeepMind出身者が作ったオープンソースのPC操作AI。12GB GPUで140ms動作、OS-World 74.2%達成。Claude Computer Useとの違い、導入方法を解説。