FlowTune Media

ChatGPTが「嘘をつきにくく」なった — GPT-5.5 Instantへの静かな切り替えで何が変わるか

5月5日、ChatGPTを開いたとき、見た目は何も変わっていなかった。

GPT-5.5 Instant

モデル名の表示が変わったわけでもなく、UIが刷新されたわけでもない。けれど裏では、全ユーザーのデフォルトモデルが GPT-5.3 Instant から GPT-5.5 Instant に差し替わっていた。OpenAIの公式発表によれば、医療・法律・金融といった高リスク領域でのハルシネーション(事実と異なる回答)が 52.5%減少。以前ユーザーがフラグを立てた不正確な回答についても 37.3%の改善 があったという。

地味なバージョンアップに見えるが、影響範囲は広い。無料ユーザーを含むすべてのChatGPT利用者に、順次ロールアウトされている。

数字の裏にある設計思想の転換

52.5%という数字だけ取ると「半分になった」程度に聞こえるが、測定対象が「高リスク領域」に限定されている点が重要だ。普段のカジュアルな雑談ではなく、薬の飲み合わせや法的手続き、財務計算など「間違えるとまずい質問」に対して、モデルが知ったかぶりをする頻度を半減させた、ということになる。

同時に、応答のスタイルも変わった。OpenAIによると、GPT-5.5 Instantは前モデルより 約30%短い応答 を生成する。単語数で30.2%減、行数で29.2%減。不必要な繰り返しや過剰な装飾、そして——これは多くのユーザーが歓迎するだろう——絵文字の乱用が抑えられている。

短くなったのは手抜きではない。「同じ情報量をより少ない言葉で伝える」方向にチューニングされている。長文の回答がデフォルトだった時代から、「聞かれたことに端的に答える」方向への意図的なシフトだ。

メモリソース — AIが「なぜそう答えたか」を見せ始めた

今回のアップデートで最も注目すべきは、メモリソースという新機能かもしれない。

GPT-5.5 Instantは、過去の会話履歴、アップロードしたファイル、接続済みのGmailから情報を引き出してパーソナライズされた回答を生成できる。ここまでは従来のメモリ機能の延長だが、新しいのは「どの記憶を参照して答えたか」をユーザーに見せる点だ。

回答のなかで「あなたは先月のチャットで○○について話していましたね」と言われたとき、メモリソースを開くと、具体的にどの過去の会話やどのファイルがその回答に影響したかが表示される。古くなった情報や間違った記憶は、そこから直接削除・修正できる。

正直、これは「透明性」としてはまだ不完全だ。OpenAIも認めているとおり、すべての参照元が表示されるわけではない。モデルが検索した会話の一部だけがソースとして表示され、今後より完全な表示を目指すとのこと。とはいえ、「AIが何を覚えていて、何を根拠に答えたか」を確認できる仕組みが標準モデルに組み込まれたのは、ユーザーとAIの関係性において意味のある一歩だ。

現時点ではPlus・Proユーザーのウェブ版から先行提供され、モバイルや他のプランへは段階的に拡大される予定。

有料ユーザーが知っておくべきこと

有料プラン(Plus、Pro)のユーザーには猶予期間がある。GPT-5.3 Instantは3ヶ月間モデルピッカーから選択可能で、すぐに消えるわけではない。新モデルの回答スタイルが合わない場合や、既存のカスタム指示との相性が気になる場合は、しばらく併用して比較できる。

無料ユーザーにはこの選択肢がない。段階的にGPT-5.5 Instantに切り替わり、旧モデルには戻せない。ただし、前述のとおり精度と簡潔さが改善されているため、体感として「悪くなった」と感じるケースは少ないだろう。

GPT-5.5 Instantの位置づけ — 「スマート」より「信頼できる」

GPT-5.5の本体は4月23日にリリースされ、ベンチマークでClaude Opus 4.7を大きく引き離すスコアを叩き出した。一方、GPT-5.5 Instantはそのフルモデルではない。Instantシリーズは、低レイテンシ・低コストで大量のリクエストをさばくために最適化された「軽量版」だ。

つまり、GPT-5.5 Instantは「最も賢いモデル」ではなく、「最も多くの人が毎日触れるモデル」だ。そのモデルのハルシネーション率が半減し、冗長な出力が3割減ったという事実は、ベンチマークの数字以上に実際のユーザー体験に効いてくる。

ChatGPTを「たまに嘘をつくが便利なやつ」として使っていた人にとって、「嘘をつく頻度が半分になった」は、信頼のラインを一段上げる変化になりうる。メモリソースで「なぜそう言ったのか」を確認できる仕組みが加われば、なおさらだ。

派手な発表ではない。だが、9億人以上が使うツールの基盤が静かに入れ替わったという意味では、今週のAIニュースのなかで最も多くの人に影響するアップデートだろう。

関連記事