# 推論モデル

10件の記事

2026-06-16

活性パラメータ760Mで数学オリンピック91.9% — 「小さいのに賢い」AIモデルの設計思想

ZAYA1-8Bは総パラメータ8.4Bながら活性760MのMoE推論モデル。AIME 91.9%の実力、AMD学習の背景、ローカル実行の可能性を解説。

ZAYA1ZyphraAIモデルオープンソースMoEローカルLLMAMD推論モデル

2026-05-25

80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日

OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。

OpenAIAIリサーチAIモデル推論モデル速報

2026-04-18

OpenAIが「ライフサイエンス専用」のAIを出した — DNA研究者の名を冠したGPT-Rosalindの正体

OpenAIが2026年4月16日に発表した生命科学特化モデルGPT-Rosalindを解説。BixBenchで0.751、Codex連携で50以上の科学ツールを操作する仕組みと、Trusted Access制の意味を整理する。

OpenAIGPT-RosalindAIモデルヘルスケア推論モデルエンタープライズ速報

2026-04-14

画像生成AIにも「考えてから描く」時代 — Alibaba Wan 2.7のThinking Modeが面白い

Alibabaの新モデルWan 2.7を解説。プロンプトを推論してから生成するThinking Mode、千面リアリズム、9枚リファレンス画像対応など、画像・動画生成の新しい切り口を整理する。

AI画像AI動画AlibabaWan中国AI画像生成推論モデル速報

2026-04-14

Muse Sparkの数日後、Metaが再び開いた — Llama 5は何をひっくり返したのか

Metaが4月8日に発表したオープンソースのLlama 5を解説。600Bパラメータ・5Mコンテキスト・System 2思考の意味と、Muse Sparkとの関係を整理する。

LLMLlamaLlama 5Metaオープンソースオープンモデル推論モデル速報

2026-04-14

ARC-AGI-2で84.6% — Gemini 3 Deep Thinkが「ひとつの科学研究員」になろうとしている

Gemini 3 Deep Thinkの2026年4月アップデートを解説。ARC-AGI-2で84.6%、HLE 48.4%、物理・化学オリンピック金メダル級、そしてAPI解放の意味をまとめる。

GeminiGoogle推論モデルAIモデルベンチマーク

2026-04-14

GPT-6 公開 — 価格据え置きで200万トークン、そしてSoraを飲み込んだ

OpenAIが2026年4月10日に公開したGPT-6を解説。2Mコンテキスト、System-1/2の二層推論、ネイティブ動画生成、価格据え置きの戦略、GPT-5.4やClaude Opus 4.6との差をまとめる。

LLMOpenAIGPT-6速報推論モデルマルチモーダル

2026-04-12

Qwen3.5にClaude Opus 4.6の思考を「移植」した27Bモデルが静かに首位を取った話

Jackrongが公開したQwen3.5-27B Claude-4.6-Opus-Reasoning-Distilledが、Hugging Face Trending1位に。Apache-2.0ライセンスでClaude風の<think>推論をローカル再現。v1/v2の違いとMLX/GGUF展開を整理する。

QwenClaudeAIモデルオープンソースローカルAI推論モデルAlibaba

2026-04-12

Phi-4-reasoning — Microsoftが証明した「小さくても賢い」推論モデルの実力

Microsoft Phi-4-reasoningの推論性能・ベンチマーク・ローカル実行方法を解説。14Bパラメータでo3-miniに迫る数学・科学推論の実力とは

AIモデルMicrosoftPhi-4推論モデルオープンソースSLM（小規模言語モデル）

2026-04-08

GPT-5.4が来た — OpenAIの最新モデルは「速さ」と「深さ」を両取りしにきた

OpenAI GPT-5.4の全貌を解説。Standard/Thinking/Proの3バリアント、105万トークン対応、ネイティブコンピュータ操作、ベンチマーク比較、Claude・Geminiとの使い分けを紹介

LLMOpenAI速報コンピュータ操作推論モデル