3つのAIに同時に聞く — Perplexity「Model Council」が検索の正解率を変える

「このAIの回答、本当に正しいのか?」
AIに調べ物を任せるようになって、多くの人が感じている不安はこれだろう。ChatGPTに聞いた答えとClaudeに聞いた答えが違う。Geminiはまた別のことを言う。結局どれが正しいのか判断するのは人間で、それなら自分で調べたほうが早い、という堂々巡り。
Perplexityの新機能「Model Council」は、この問題に対する明快な回答だ。GPT-5.4、Claude Opus 4.6、Gemini 3.1 Proの3モデルを同時に走らせ、それぞれの回答を比較した上で、合意点と相違点を整理して提示する。
2月6日にリリースされ、現在はWeb版のPerplexity Maxユーザー(月額$20、約3,000円)が利用できる。
「多数決」ではない
Model Councilの仕組みは単純な多数決ではない。3つのモデルに同じクエリを投げ、それぞれの回答をシンセサイザーモデルがレビューする。どこで一致しているか、どこで食い違っているか、各モデルが独自に貢献している情報は何か。それらを統合して1つの回答として返す。
たとえば「2026年のAIスタートアップ投資額は?」と聞いたとき、あるモデルはQ1全体の数字を返し、別のモデルはAI特化の内訳を返し、もう一つは前年比の成長率を返す。Model Councilはこれらを照合し、ソース付きで統合された回答を生成する。
正直、これは検索AIの進化として自然だし、なぜ今まで誰もやらなかったのかと思う。単一モデルの限界は、そのモデルの学習データと推論の癖に依存することだ。複数モデルを並列で走らせれば、個々のモデルの盲点を補完できる。
Deep Researchも強化された
Model Councilと同時期に、Perplexityの目玉機能「Deep Research」もアップグレードされている。
Deep Researchは通常の検索とは異なり、質問を受け取ると2〜5分かけて数十のソースを読み込み、推論を重ね、構造化されたレポートを出力する。Google DeepMindのDeep Search QAやScale AIのResearch Rubricといった外部ベンチマークで、他のDeep Researchツールを精度・信頼性で上回ったと発表されている。
Max/Proユーザー向けにはOpus 4.6がデフォルトモデルとして設定されており、ブラウザエージェントのモデルも選択可能になった。
3月にはAgent APIも公開され、開発者がPerplexityの検索・推論能力をプログラムから利用できるようになった。200億ページ以上のWebインデックスに直接アクセスできるAPIは、他にない強みだ。
メモリ機能の進化
地味だが実用的なのがメモリ機能の強化だ。Perplexityがユーザーとの会話からより豊かな記憶を生成し、過去の文脈を踏まえた回答ができるようになった。
「先週調べたあの論文の著者名」のような、曖昧だが本人にとっては明確な質問にも答えられるようになる。検索ツールが「自分の検索履歴を知っている秘書」に近づいている。
料金体系
| プラン | 月額 | Model Council | |--------|------|---------------| | Free | $0 | 不可 | | Pro | $20(約3,000円) | 不可 | | Max | $200(約30,000円) | 利用可能 |
Model CouncilはMaxプラン限定。月額$200はかなり強気だが、リサーチ業務が主な職種—アナリスト、コンサルタント、ジャーナリスト—にとっては、複数AIを手動で比較する時間を買えると考えれば合理的な投資ではある。
Deep ResearchはProプラン以上で利用可能。こちらは月額$20で手が届く。
微妙な点
Model Councilの制約は明確だ。まずMaxプラン限定という価格の壁。月額$200は個人ユーザーには高い。次に、現時点ではWeb版のみで、モバイルアプリでは使えない。
そしてより本質的な問題として、3モデルの合議が常に正しいとは限らない。3つとも同じ方向に間違える可能性はある。「複数モデルが一致した=正しい」という思考停止に陥るリスクは、単一モデルを使うときとは別の形で存在する。
とはいえ、単一モデルの回答よりも信頼性が高いのは確かだ。完璧ではないが、方向性は正しい。
誰に向いているか
Perplexityは2026年の検索AI分野で、もっとも進化の速度が速いプレイヤーだ。Model Council、Deep Research強化、Agent API、メモリ改善。1〜2ヶ月の間にこれだけの機能を投入してきた。
リサーチの正確性を重視するプロフェッショナルには、現時点で最も検討に値するAI検索ツールだと思う。無料で始めて、$20のProプランでDeep Researchを試し、本格的に使うならMaxへ。段階的に試せる料金体系も悪くない。
関連記事
GensparkはChatGPTとPerplexityを食うのか? — 70以上のAIモデルを束ねるワークスペースの実力
ARR 1億ドル到達まで9ヶ月。評価額16億ドル。累計調達額5.45億ドル。 Genspark(https://www.genspark.ai/)の数字は、AIスタートアップとして異常なペースだ。元Baiduの副社長Eric Jing氏が2023年に創業し、2026年4月にはSeries Bを3.85億ドルまで拡張
Claude Opus 4.6を1ヶ月使った所感 — 100万トークンとエージェントチームの実力
!Claude Opus 4.6(/images/posts/claude-opus-4-6-anthropic.png) Anthropicが2月5日にリリースしたClaude Opus 4.6を、約2ヶ月間、主に開発業務とリサーチで使い込んできた。率直に言って、コーディング用途ではこれが現時点のベストだと思って
DeepSeek V4が示す新しい勢力図 — 1兆パラメータ、Huaweiチップ、$0.30/Mトークンの衝撃
!DeepSeek V4(/images/posts/deepseek-v4-multimodal.jpg) DeepSeekがまた市場を揺らす。今度は1兆パラメータだ。 2026年4月、中国のAIスタートアップDeepSeek(https://www.deepseek.com/)が次世代モデル「DeepSeek