FlowTune Media

OpenAIが「ライフサイエンス専用」のAIを出した — DNA研究者の名を冠したGPT-Rosalindの正体

GPT-5やClaude Opusのような汎用モデルが進化を続けるなかで、「特定領域に特化したモデル」が公式に登場するのは久しぶりだ。それも、OpenAIから。

2026年4月16日、OpenAIは生命科学(ライフサイエンス)に特化した推論モデルGPT-Rosalindをリサーチプレビューとして発表した。命名はDNAの二重らせん構造の解明に貢献した英国の化学者ロザリンド・フランクリン。生物学・創薬・トランスレーショナル医学(基礎研究を臨床応用に橋渡しする領域)の研究ワークフローを高速化することを目的としている。

なぜ「専用モデル」を出したのか

GPT-5.4はすでに非常に汎用性の高いモデルだ。コードを書くのも、論文を要約するのも、画像を理解するのも、たいていのことはこなす。それでもOpenAIが領域特化モデルをわざわざ作った理由は、ベンチマークの数字を見ると分かりやすい。

GPT-RosalindはBixBench(実世界のバイオインフォマティクスとデータ解析を測るベンチマーク)で0.751のpass rateを達成。LABBench2(実験室タスクのベンチマーク)では11タスク中6つでGPT-5.4を上回った。特に大きく差が出たのはCloningQA — 分子クローニングのプロトコル設計でエンドツーエンドに試薬を組み立てるタスクだ。

汎用モデルが「論文を読んで要約する」ところまでは余裕でできる一方、「タンパク質配列から機能を推測し、必要な実験を設計し、結果を解釈する」というワークフローでは、専用モデルのほうが確実な性能を出せる。OpenAIは公式発表で、分子・タンパク質・遺伝子・シグナル経路・疾患関連生物学の推論科学ツール・データベースの多段階利用の2点で強化したと説明している。

Codexのライフサイエンスプラグインが鍵

GPT-Rosalindの真価は、モデル単体ではなくCodex向けライフサイエンス研究プラグインとの組み合わせで発揮される。このプラグインは50以上の科学ツールやデータベースに接続できるという。

具体例を挙げると、こういう使い方になる。

「このがん患者のRNA-seqデータから、特定のシグナル経路が活性化しているかを調べてほしい。関連する論文も10本ピックアップして、過去5年で報告された治療標的とのマッピングを作ってくれ」

汎用モデルなら、似たような回答は返ってくるかもしれない。だがGPT-RosalindとCodexプラグインの組み合わせなら、実際にデータベース(GenBank、UniProt、PubMed等)にアクセスし、解析ツール(DESeq2やGSEA)を呼び出し、結果を統合してレポートを返すところまで自動化できる、というのがOpenAIの主張だ。

研究者にとって、この差は決定的だ。「LLMに質問するために前処理をする」のと、「LLMが前処理ごと実行してくれる」のでは、ワークフローの形が変わる。

誰でも使えるわけではない

ただし、GPT-Rosalindは誰でも触れるモデルではない。OpenAIはTrusted Access programという制限付きの提供形態を採用した。

理由は明白で、生物学関連モデルには生物兵器転用のリスクがつきまとう。タンパク質設計やDNA合成のプロトコル生成は、医薬品開発に使えると同時に、悪意ある用途にも転用しうる。OpenAIはこのリスクを評価したうえで、ガバナンス・セキュリティ・監督の要件を満たした顧客にのみ提供することを決めた。

ローンチパートナーとして公表されているのはAmgen、Moderna、Allen Institute、Thermo Fisher Scientificの4社。いずれも生命科学分野で確立した研究機関・製薬企業だ。提供開始は米国のEnterpriseユーザー向けからで、日本を含む他地域への展開時期は明らかにされていない。

この「クローズド提供」というスタンスは、Anthropicが2025年にも採ったサイバーセキュリティ特化のProject Glasswingに近い。両社とも、リスクの高い領域では汎用モデルとは別経路で慎重に展開する方針が見えてくる。

競合の動き

OpenAIだけが生命科学AIに本気を出しているわけではない。

Anthropicは2025年にCoefficient(生物学特化のAI企業)を買収している。Coefficientの技術を取り込んでClaude系モデルの生命科学能力を底上げする狙いだとみられている。

NVIDIAは数年前からBioNeMoというプラットフォームを展開しており、製薬企業向けにタンパク質構造予測や分子設計のモデルを提供している。GPUベンダー特有の深いインフラ統合が強みだ。

Google DeepMindはAlphaFoldシリーズを長年磨き続けており、タンパク質構造予測の領域では事実上の標準になっている。Isomorphic Labsという子会社で創薬への応用も進めている。

これらと比べると、GPT-Rosalindの差別化は「汎用LLMの推論能力 + 多段階のツール利用」にある。AlphaFoldのように構造を出すのが目的ではなく、「論文を読み、データを解析し、次の実験を計画する」までの研究プロセスを横断的にサポートしようとしている、と読める。

日本の研究現場には届くか

正直に書くと、日本の大学研究室や製薬企業に降りてくるのはまだ先だ。Trusted Access programが米国Enterprise限定でスタートした以上、日本の研究機関がこのモデルを直接触れるのは早くても数ヶ月〜半年後と見ておくべきだろう。

それでも、この発表が示唆するものは大きい。「汎用モデルでなんでもできる」という方向性に対して、OpenAI自身が「領域特化が必要なドメインがある」と認めた格好だ。生命科学の次に来る特化モデルが何になるかは想像の余地があるが、リーガルテック、金融、化学工学、半導体設計あたりは候補として挙げられそうだ。

すでにOpenAIは攻撃前検知に特化したサイバーセキュリティモデルAardvarkも出しており、領域特化モデルのラインナップを着実に増やしている。GPT-Rosalindはその流れの中で、最も「ハイリスク・ハイリワード」な領域に踏み込んだ一手と言える。

リサーチプレビューの段階なので、性能評価が固まるのはこれから。それでも、生命科学の研究現場をAIがどう変えるかを見たい人にとって、GPT-Rosalindは今後数年の試金石になるはずだ。

関連記事