80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日
OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。
9件の記事
OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。
OpenAIが2026年4月16日に発表した生命科学特化モデルGPT-Rosalindを解説。BixBenchで0.751、Codex連携で50以上の科学ツールを操作する仕組みと、Trusted Access制の意味を整理する。
Alibabaの新モデルWan 2.7を解説。プロンプトを推論してから生成するThinking Mode、千面リアリズム、9枚リファレンス画像対応など、画像・動画生成の新しい切り口を整理する。
Metaが4月8日に発表したオープンソースのLlama 5を解説。600Bパラメータ・5Mコンテキスト・System 2思考の意味と、Muse Sparkとの関係を整理する。
Gemini 3 Deep Thinkの2026年4月アップデートを解説。ARC-AGI-2で84.6%、HLE 48.4%、物理・化学オリンピック金メダル級、そしてAPI解放の意味をまとめる。
OpenAIが2026年4月10日に公開したGPT-6を解説。2Mコンテキスト、System-1/2の二層推論、ネイティブ動画生成、価格据え置きの戦略、GPT-5.4やClaude Opus 4.6との差をまとめる。
Jackrongが公開したQwen3.5-27B Claude-4.6-Opus-Reasoning-Distilledが、Hugging Face Trending1位に。Apache-2.0ライセンスでClaude風の<think>推論をローカル再現。v1/v2の違いとMLX/GGUF展開を整理する。
Microsoft Phi-4-reasoningの推論性能・ベンチマーク・ローカル実行方法を解説。14Bパラメータでo3-miniに迫る数学・科学推論の実力とは
OpenAI GPT-5.4の全貌を解説。Standard/Thinking/Proの3バリアント、105万トークン対応、ネイティブコンピュータ操作、ベンチマーク比較、Claude・Geminiとの使い分けを紹介