80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日
1946年、ハンガリーの数学者パウル・エルデシュが一つの問いを立てた。
「平面上にn個の点を置いたとき、ちょうど距離1だけ離れた点のペアは最大いくつ作れるか?」
小学生でも理解できるほどシンプルな問いだ。しかしこの問題は、離散幾何学で「最も有名で、最も説明が簡単な未解決問題」と呼ばれ続けた。80年間、世界中の数学者が挑み、誰も決定的な答えを出せなかった。
2026年5月20日、OpenAIがその均衡を破った。同社の内部推論モデルが、エルデシュ予想の中核にあった「正方格子が最適」という80年来の通説を反証したのだ。
何が起きたのか
エルデシュ予想を簡単に説明する。
平面に点を散りばめたとき、「ちょうど1の距離で結ばれるペア」の数には上限がある。この上限がどう増えるかが問題の本質だ。点の数nを増やすと、距離1のペアもある程度は増える。問題は「どれくらい速く増えるか」だ。
80年間、数学者たちは正方格子——つまり方眼紙のような等間隔の配置——がほぼ最適だと信じてきた。この配置だと、距離1のペアの数はn^(1+c/log log n)のオーダーで増える。対数の対数という、ほとんど定数に近い成長率。直感的にはn×(定数)に近い。
OpenAIのモデルはここに切り込んだ。正方格子を超える配置が存在することを示し、ペアの数がn^(1+δ)(δは固定の正の値)で増える無限の点配置族を構築した。対数の対数ではなく、真の多項式的な改善。80年間「正しい」と思われていた上限が、実は正しくなかったことの証明だ。
代数的整数論が幾何学に侵入した
証明の核心は意外なところにあった。
離散幾何学の問題に対して、モデルは代数的整数論のツールを持ち込んだ。具体的には、代数体の整数環における因数分解の性質を利用し、通常の平面では不可能な対称性を持つ点配置を構築した。
数学者のノガ・アロンはこの手法を「代数的整数論のかなり洗練されたツールをエレガントかつ巧みに応用している」と評した。人間の数学者であれば、幾何学の問題に対して整数論から攻めようという発想自体が生まれにくい。異なる分野のツールを自然に横断する——AIならではの「バイアスのなさ」が機能した瞬間だろう。
フィールズ賞受賞者が「驚いた」と言った
この証明の検証には、外部の数学者グループが参加した。その中で最も注目すべき評価を下したのは、フィールズ賞受賞者のティモシー・ガワーズだ。
ガワーズは証明を精査した上で「数学のトップジャーナル『Annals of Mathematics』に躊躇なく受理するレベル」と述べた。さらに「これまでのAI生成の証明で、このレベルに近づいたものはない」とも。
ここが重要なポイントだ。AIがベンチマークで高得点を取ることと、一流の数学者が「本物の貢献」と認めることは、まったく別のハードルだ。後者を初めてクリアした。
数論学者のアルル・シャンカルは「現在のAIモデルは、もはや人間の数学者の『助手』を超えている。独自の天才的なアイデアを持ち、それを最後まで実行に移す能力がある」と語った。
人間が証明しようとしたことを、AIは反証した
この話で最も示唆的なのは、人間とAIの「探索方向の違い」だ。
過去80年間、多くの数学者は正方格子が最適であることを証明しようとしていた。反例を探そうとした研究者もいたが、反例を見つけるための計算は膨大で退屈な作業を伴い、途中で成功の兆しが見えなければ人間は諦める。
AIは違う。OpenAIの発表によれば、「LLMは試行錯誤のコストと利益を人間とは異なる形で経験する」。成功の兆しがなくても延々と計算を続け、膨大な組み合わせの中から反例の構造を発見できる。
これは「AIが人間より賢い」という話ではない。探索空間の中で、人間が心理的に避ける領域にAIが踏み込めるという話だ。
ここがすごくて、ここが怖い
率直に言って、この成果は衝撃的だ。
すごい点:
特定のタスク用にチューニングされたモデルではなく、汎用の推論モデルが問題文を受け取って独力で証明を完成させた。既存の文献から答えをコピーしたわけでもない。代数的整数論と離散幾何学という異分野をつなぐ発想を、モデルが自力で生み出した。
AIが数学オリンピックの問題を解くのとは次元が違う。競技問題には答えが存在することが保証されている。未解決問題には、そもそも答えがあるかどうかすらわからない。
気になる点:
OpenAIは「内部モデル」としか言っていない。モデル名も、アーキテクチャの詳細も、学習データに何が含まれていたかも非公開だ。再現性の検証ができない。証明そのものはarXiv(2605.20695v1)で公開されているが、「このモデルでなければこの証明は出なかったのか」「別のモデルでも同じ発見ができるのか」は誰にもわからない。
また、数学のコミュニティからは「証明の検証に協力したが、モデルの能力を検証したわけではない」という声もある。証明の正しさと、AIの数学的能力の評価は別の話だ。
AIが数学者の「同僚」になる日
この成果から読み取れる今後の可能性がいくつかある。
まず、AIが未解決問題に対して「反例探索」のツールとして定着する可能性が高い。人間が心理的バイアスで避ける方向を、AIが網羅的に探索する。今回の成功が再現可能であれば、数論、組合せ論、トポロジーなど他の分野でも同じアプローチが適用できるはずだ。
次に、異分野のツールを横断する能力。代数的整数論を幾何学に適用するという発想は、人間の専門家には生まれにくい。AIは分野の境界を認識しない。この「素朴さ」が、人間の研究者が数十年見落としてきたつながりを発見する武器になる。
ただし、これが「AIが数学者を置き換える」という話に飛躍するのは早い。今回の証明はあくまで「構成的な反例」——条件を満たす具体的な構造を見つけた——であり、「なぜそれが機能するか」の深い理解をAIが持っているかは不明だ。数学は証明を生むだけでなく、その証明から新しい問いを立てる営みでもある。後者はまだ人間の領域に見える。
それでも、この一歩は重い。フィールズ賞受賞者が「トップジャーナル水準」と認めた初のAI証明。数学の歴史にAIの名前が刻まれた日として、2026年5月20日は記憶されるだろう。
関連記事
OpenAIが「ライフサイエンス専用」のAIを出した — DNA研究者の名を冠したGPT-Rosalindの正体
OpenAIが2026年4月16日に発表した生命科学特化モデルGPT-Rosalindを解説。BixBenchで0.751、Codex連携で50以上の科学ツールを操作する仕組みと、Trusted Access制の意味を整理する。
コストは50分の1、コンテキストは12倍 — 「Transformerの次」を名乗るSubQの実力
SubQは世界初の完全サブクアドラティックLLM。1,200万トークンのコンテキストでClaude Opusを上回るベンチマーク結果を出した新アーキテクチャの仕組みと実力を解説。
ChatGPTが「嘘をつきにくく」なった — GPT-5.5 Instantへの静かな切り替えで何が変わるか
ChatGPTデフォルトがGPT-5.5 Instantに。嘘半減・応答3割短縮・メモリソースの変更点を整理。