80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日
OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。
19件の記事
OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。
Andrej KarpathyがAnthropicの事前学習チームに参画。OpenAI共同創業者の電撃移籍が意味するもの、新チームの役割、AI業界の人材競争への影響を分析する。
BaiduのERNIE 5.1は訓練コストを同規模モデルの6%に抑えつつ、Arena Search世界4位・AIME26で99.6点を達成。Once-For-All弾性学習の仕組みと中国AI競争の現在地を解説。
元OpenAI CTO創業Thinking Machines Labの0.4秒応答フルデュプレックスAI「Interaction Models」を解説。
SubQは世界初の完全サブクアドラティックLLM。1,200万トークンのコンテキストでClaude Opusを上回るベンチマーク結果を出した新アーキテクチャの仕組みと実力を解説。
Recursive Superintelligenceが$650M調達、評価額$4.65B。元Salesforce AI・DeepMindの研究者が率いる「再帰的自己改善AI」の技術アプローチと業界への影響を解説。
NotebookLMとNotion AIを料金・分析精度・チーム利用など5軸で徹底比較。目的別の選び方と、両方使う併用パターンまで解説します。
Anara(旧Unriddle AI)はPDF・動画・音声を横断してAIで論文リサーチできるツール。v3.0の機能、料金、NotebookLMとの違いを整理する。
Hugging Face公式のOSSエージェント「ml-intern」を解説。arXiv論文の自動巡回からLLMのファインチューニング、評価まで自律実行する仕組みと実際の改善実績を紹介。
NotebookLMにGeminiの100万トークンが解放。会話容量6倍、カスタムペルソナ対応でリサーチツールとして進化した。
Andrej Karpathy発のAutoResearchを解説。AIエージェントがコード修正→学習→評価を一晩中ループし、GPU1枚で100回以上の実験を自動実行する仕組み。
UC Berkeleyの研究チームがSWE-bench・WebArena・GAIAなど主要8AIエージェントベンチマークすべてで「タスクを解かずに満点」を達成。評価の脆弱性と業界への警鐘を整理する。
スタンフォードHAIが2026年4月13日に公開した最新AI Indexレポートを読み解く。米中性能差ほぼ消滅、推論コスト280倍減、Q1投資2858億ドルなど、業界の輪郭を変える数字を整理する。
PerplexityのDeep ResearchがPPTX・XLSX・ダッシュボードを直接生成する新機能を解説。Google Driveエクスポート、実務での使い所、ChatGPT Canvasとの違いを整理する。
Anthropicがベータ提供中のClaude Interactive Visualizations。チャット内でHTML/SVGのチャートやダイアグラムを生成し、会話と共に変化する。ChatGPT Canvasとの違いと実戦的な使い所を解説。
ヤン・ルカンが設立したAMI Labsは、LLMに代わる「ワールドモデル」を構築するパリ発のAIスタートアップ。$1.03Bの資金調達、JEPAアーキテクチャ、AI業界への影響を解説。
プロダクト未公開で評価額$44.8億のAIスタートアップHumans&の創業チーム、技術戦略、巨額シード資金調達の背景と懸念点を徹底解説する
NotebookLMの2026年アップデートを総まとめ。動画生成、PPTX出力、カスタムペルソナなど無料で使える新機能の実力を解説する
評価額4000億円の日本発AIユニコーンSakana AIを解説。Transformer共著者が東京で進める進化的モデルマージの技術、Google提携の狙い、懸念点を整理する。