# AIモデル

GoogleGeminiGemini 3.5AIモデルDeep Think速報

Sundar Pichaiが「来月には」と言ったあのモデル — Gemini 3.5 Proが6月に来る

Google I/O 2026で「6月に届ける」と予告されたGemini 3.5 Proの全貌を整理。Flashが落とした推論性能と長コンテキストをProがどう取り戻すか、Opus 4.8とGPT-5.5との競争位置を解説する。

MicrosoftMAI-Code-1GitHub CopilotAIコーディングAIモデルSWE-bench速報

GitHub Copilotに「OpenAI由来じゃない自社モデル」が静かに入った — Claude Haiku 4.5を16ポイント上回るMAI-Code-1-Flash

Microsoftが6月2日に発表したコーディング特化モデル「MAI-Code-1-Flash」を解説。SWE-Bench Pro 51.2%とトークン60%削減を実現したCopilot内製モデルの実力と意味を整理する。

MicrosoftMAI-Thinking-1MAI-Code-1AIモデルGitHub Copilot速報

Microsoftがついに「自前のAI」を作った — OpenAI抜きで動くMAI-Thinking-1の意味

Microsoft Build 2026で発表されたMAI-Thinking-1とMAI-Code-1-Flashを解説。OpenAIデータ未使用、Claude Haiku相当の性能、GitHub Copilotへの統合まで整理する。

QwenAlibabaAIモデルマルチモーダルAIエージェント中国AI

見て、考えて、コードを書いて、自分で検証する — Qwen 3.7-Plusが持つ5つのエージェント能力

Alibaba Qwen 3.7-Plusは画像・動画を理解するマルチモーダルAI。5つのエージェント能力、Maxとの違い、API料金を解説する。

2026-06-02

GPT-5.5を超え、価格は10分の1 — MiniMax M3の実力と死角

MiniMax M3はGPT-5.5超えのコーディング力を1/10価格で実現するオープンウェイトモデル。実力と課題を解説

MiniMaxAIモデルオープンモデルAIコーディング中国AILLM

2026-06-01

GPT-5.5の3週間後にもう次が見えた — GPT-5.6「iris-alpha」リークから読み取れること

CodexログからGPT-5.6リーク。1.5Mコンテキスト、コードネームiris-alpha。判明情報を整理。

OpenAIChatGPTAIモデル速報

2026-05-25

「AIがAIを訓練する」時代が来た — Adaption AutoScientistが変えるモデル学習の常識

Adaptionが公開したAutoScientistは、データとトレーニングレシピを自動で共同最適化するツール。勝率48%→64%の改善実績と仕組みを解説。

AIモデルAIプラットフォームオープンソース強化学習AdaptionAutoScientistAIスタートアップ資金調達

2026-05-25

80年間証明できなかった数学の予想を、AIが反証した — OpenAIが幾何学の歴史を変えた日

OpenAIの推論モデルが1946年のエルデシュ予想を自律的に反証。代数的整数論を使った証明の中身、フィールズ賞数学者の評価、AI数学の今後を解説。

OpenAIAIリサーチAIモデル推論モデル速報

2026-05-24

35時間放置したらコードが10倍速くなっていた — Qwen 3.7 Maxの自律コーディング実験

Qwen 3.7 Maxが知能指数1位。Opus比1/10の料金で35時間自律コーディング。性能と制約を整理

QwenAlibabaAIモデルAIコーディングLLM中国AI速報

2026-05-20

Flashなのにフラッグシップより速くて強い — Gemini 3.5 Flashが「安いモデル」の常識を壊した

Gemini 3.5 Flashはエージェント性能首位で4倍速。API価格Opusの1/10。使い分けを解説

GeminiGoogleGoogle I/OAIモデルAIエージェントベンチマーク速報

2026-05-20

Cursor Composer 2.5 — Opus 4.7と同じスコアを、10分の1の値段で出すモデルが来た

Cursor自社モデルComposer 2.5がリリース。SWE-Bench Multilingual 79.8%でOpus 4.7に匹敵しながらコスト1/10。ベンチマーク、料金、Composer 2との違いを解説。

AIコーディングCursorAIモデルコーディングベンチマーク

2026-05-18

訓練コスト94%削減でDeepSeekを超えた — Baiduの新モデルERNIE 5.1が示す「安く作って強い」の現実解

BaiduのERNIE 5.1は訓練コストを同規模モデルの6%に抑えつつ、Arena Search世界4位・AIME26で99.6点を達成。Once-For-All弾性学習の仕組みと中国AI競争の現在地を解説。

BaiduERNIE中国AIAIモデルDeepSeekAIリサーチ

2026-05-15

コストは50分の1、コンテキストは12倍 — 「Transformerの次」を名乗るSubQの実力

SubQは世界初の完全サブクアドラティックLLM。1,200万トークンのコンテキストでClaude Opusを上回るベンチマーク結果を出した新アーキテクチャの仕組みと実力を解説。

SubQLLMAIリサーチAIモデル速報

2026-05-07

Google I/O 2026、AI関連で注目すべき5つの発表予想 — Gemini 4はあるのか

Google I/O 2026（5月19-20日）のAI関連発表を先読み。Gemini 4の可能性、エージェントコーディング、Android 17のAI統合など注目ポイントを整理する。

GoogleGoogle I/OGeminiAIモデル速報

2026-05-06

ChatGPTが「嘘をつきにくく」なった — GPT-5.5 Instantへの静かな切り替えで何が変わるか

ChatGPTデフォルトがGPT-5.5 Instantに。嘘半減・応答3割短縮・メモリソースの変更点を整理。

OpenAIChatGPTAIモデルLLM速報

2026-05-05

DeepSeek V4が「GPT-5.5の97%引き」で殴り込んできた — ProとFlashの使い分けガイド

DeepSeek V4はPro/Flashの2構成。GPT-5.5比97%安でコーディング互角。料金と使い分けを解説。

DeepSeekオープンソースAIモデルMoEAIコーディング速報

2026-05-05

自分のコードを自分で直すAIが現れた — MiniMax M2.7の「自己進化」は何が新しいのか

MiniMax M2.7は100回以上の自律改善ループで自身のスキャフォールドを最適化するオープンソースLLM。SWE-Pro 56%、入力$0.30/M。自己進化の仕組みと実際の使い道を整理した。

MiniMaxAIモデルAIエージェントオープンソース速報

2026-05-05

Grok 4.3、Claude Opusの12分の1の価格で1Mコンテキスト — さらに声もコピーする

xAIがGrok 4.3をリリース。入力$1.25/100万トークンでClaude Opus 4.7の約12分の1。1Mコンテキスト、動画入力、音声クローニングの3機能を同時追加。料金・性能・活用法を整理した。

GrokxAIボイスクローンAIモデル速報

2026-05-01

コーディングAIを「クラウドに放り投げる」時代が来た — Mistral Medium 3.5とVibe Remote Agentsの正体

Mistral AIが128B旗艦モデル「Medium 3.5」とクラウド非同期コーディング「Vibe Remote Agents」を発表。SWE-Bench 77.6%、256kコンテキスト、オープンウェイト。性能・料金・使い方を解説。

MistralMistral VibeLe ChatAIコーディングAIモデルオープンソース速報

2026-04-27

プロンプト1つでLLMをファインチューニング＆デプロイ — Pioneer（Fastino）の仕組みと可能性

Pioneer（Fastino）はプロンプト1つでLLMのファインチューニングからデプロイまでを自動化するAIエージェント。Adaptive Inferenceやサポートモデル、注意点を解説。

Pioneer (Fastino)LLMAIモデルオープンソースAIプラットフォームレビュー

2026-04-25

295Bパラメータをオープンソースで — Tencentの新モデルHy3が静かに出してきた数字

Tencentが295B MoEモデル「Hy3 Preview」をオープンソース公開。SWE-bench 74.4%の実力、入力0.18ドルの価格、既存サービスへの統合状況を解説する。

TencentHunyuan中国AIAIモデルオープンソースLLMMoE

2026-04-24

GPU1枚でClaude Opus 4.5と並ぶ — Qwen3.6-27Bという「密モデル」の衝撃

Alibaba発のQwen3.6-27Bは27Bパラメータの密モデルでClaude Opus 4.5級のコーディング性能を実現。RTX 4090で動くフロンティア級モデルの実力と限界を解説。

QwenAlibabaAIモデルオープンソースローカルLLMAIコーディング

2026-04-24

ロボットの「脳」だけを作る会社に675億円が集まった — Rhoda AIの賭け

Rhoda AIは数億本の動画から物理法則を学ぶロボット知能基盤モデルを開発。$450M調達・$1.7B評価の技術と、Figure AIとの違いを解説する。

Rhoda AIロボティクスフィジカルAIAIモデルスタートアップ資金調達

2026-04-20

Anthropicの内部資料から漏れた「Capybara」— Opusの上に第4のティアが存在する

Anthropicのデータリークで判明した「Capybara」ティアの全体像。Opus上位の第4階層、Mythosモデルとの関係、料金体系の変化を解説する。

ClaudeAnthropicMythosAIモデル速報

2026-04-19

TikTokの親会社が作った「何でも屋AI」が静かにベンチマークを塗り替えている — Seed 1.8の正体

ByteDanceが開発したエージェント特化モデルSeed 1.8を解説。GUI操作・検索・コード生成を統合し、BrowseCompでGemini超え。Doubaoの基盤としての位置づけと料金を整理する。

Seed 1.8ByteDanceAIモデルAIエージェントDoubao中国AI速報

2026-04-19

Claudeが「バカになった」問題の全貌 — 6,852セッションの分析データと、Anthropicが認めたこと

2026年4月、Claude Codeの品質低下がAMD責任者の実データ分析で裏付けられた。effort level変更の経緯、Anthropicの公式見解、ユーザーが取れる対策を時系列で整理する。

ClaudeClaude CodeAnthropicAIモデル速報

2026-04-18

OpenAIが「ライフサイエンス専用」のAIを出した — DNA研究者の名を冠したGPT-Rosalindの正体

OpenAIが2026年4月16日に発表した生命科学特化モデルGPT-Rosalindを解説。BixBenchで0.751、Codex連携で50以上の科学ツールを操作する仕組みと、Trusted Access制の意味を整理する。

OpenAIGPT-RosalindAIモデルヘルスケア推論モデルエンタープライズ速報

2026-04-18

月4万5千円のAIチャット — Grok 4.3 betaが「文書を作れるAI」に変わった理由

xAIが4月17日にリリースしたGrok 4.3 betaの全貌。PDF・PowerPoint・スプレッドシート生成、動画入力に対応。SuperGrok Heavy月額$300の価値を検証する。

GrokxAIAIモデル

TencentHunyuan中国AIAIモデルAIエージェントWeChat速報

WeChatの13億ユーザーにAIエージェントが届く — Tencent Hunyuan 3.0が意味すること

Tencentが次世代LLM Hunyuan 3.0を4月にリリース予定。300億パラメータ、WeChat AIエージェント統合、元OpenAI研究者が主導する開発体制を整理する。

World LabsAIクリエイティブAI画像3D生成AIモデル速報

写真1枚から歩ける3D空間を作る — Fei-Fei Li率いるWorld Labsの「Marble 1.1」がやっていること

World LabsのMarble 1.1は写真やテキストから探索可能な3D空間を生成するAI。自動拡張機能・料金・用途・競合との違いを整理した。

QwenGemmaAlibabaGoogleAIモデルオープンソースAIコーディング比較

パラメータの9割を寝かせて勝つモデル vs 全弾フル稼働の31B — Qwen 3.6とGemma 4、開発者はどちらを選ぶべきか

Qwen3.6-35B-A3BとGemma 4-31Bを主要ベンチマーク・VRAM消費・ライセンスで比較。用途別の選び方を整理した。

QwenAlibabaAIモデルマルチモーダル中国AI

カメラに映した手書きスケッチからReactアプリを作る — Qwen 3.5-Omniの衝撃と、クローズド化の波紋

Alibaba Qwen 3.5-Omniはテキスト・画像・音声・動画を統合処理するマルチモーダルAI。カメラ入力からのコード生成やAPI料金を解説。

2026-04-15

Claudeより96%安い米国製のオープンモデルが、こっそりPinchBench 2位に上がってきた話

米Arcee AIが400BのOSS推論モデルTrinity-Large-ThinkingをApache 2.0で公開。Claude Opus 4.6比96%安、長期エージェント特化の中身と評価を整理する。

Arcee AITrinityオープンソースAIモデルLLMAIエージェント

2026-04-15

Mistralが縛りを外した — Codestral 2がApache 2.0で降ってきた日

Mistralがコード生成モデルCodestral 2をApache 2.0で公開。前モデルの商用制限が外れた意味、22Bのスペック、DeepSeek CoderやQwen3との立ち位置、ローカルで動かす現実的な使い道を整理する。

MistralCodestralAIコーディングAIモデルオープンソースLLM速報

2026-04-15

量子コンピュータの「計算ミス」をAIが3倍の精度で直す — NVIDIAが放ったIsing

NVIDIAが量子コンピュータ向け初のオープンソースAIモデル群Isingを公開。誤り訂正とキャリブレーションをAIで高速化する中身、採用機関、量子株の反応を整理する。

NVIDIANVIDIA Ising量子コンピュータAIモデルオープンソース速報

GeminiGoogle推論モデルAIモデルベンチマーク

ARC-AGI-2で84.6% — Gemini 3 Deep Thinkが「ひとつの科学研究員」になろうとしている

Gemini 3 Deep Thinkの2026年4月アップデートを解説。ARC-AGI-2で84.6%、HLE 48.4%、物理・化学オリンピック金メダル級、そしてAPI解放の意味をまとめる。

OpenAIChatGPTGPT-5LLMAIモデル速報

"Spud" と呼ばれているモデルが4月末に来るかもしれない — OpenAIの次期フラッグシップをめぐる既知と未知

OpenAIの次期モデル（コードネームSpud）は2026年3月24日にプリトレーニング完了。GPT-5.5とGPT-6のどちらで出るのか、リリース予測、Brockman発言の読み解き方まで、現時点で確実な情報と推測を分けて整理する。

GemmaGeminiGoogleAndroidローカルAIエッジAISLM（小規模言語モデル）AIモデル

スマホの中のAIが4倍速くなる日 — Androidに降りてきたGemma 4とGemini Nano 4

GoogleがGemma 4ベースのGemini Nano 4をAndroid AICore Developer Previewで公開。4倍速・電力60%減・140言語対応のオンデバイスAIで何が実現できるか、開発者向け要点をまとめる。

Chandra OCROCRオープンソースAIモデルDatalabドキュメントAIローカルAI

手書きも表もPDFも、まとめてテキストに変換する無料AI — Chandra OCR 2の実力

Datalabが公開したオープンソースOCRモデルChandra OCR 2を紹介。olmOCRベンチマーク85.9%、4Bパラメータ、手書き・表・数式・90言語対応。Gemini 2.5 Flashを上回った理由と実用シーンを整理する。

2026-04-13

ChatGPTの裏で動いている「控えのAI」が、静かに賢くなっていた — GPT-5.3 Instant Mini

OpenAIがChatGPTのフォールバックモデルGPT-5.3 Instant Miniを公開。モデルピッカーに出てこない「無料・Plus枠の控え選手」が何を改善したか、無料ユーザーに効く理由を整理する。

ChatGPTOpenAIAIモデルLLM速報

2026-04-12

Qwen3.5にClaude Opus 4.6の思考を「移植」した27Bモデルが静かに首位を取った話

Jackrongが公開したQwen3.5-27B Claude-4.6-Opus-Reasoning-Distilledが、Hugging Face Trending1位に。Apache-2.0ライセンスでClaude風の<think>推論をローカル再現。v1/v2の違いとMLX/GGUF展開を整理する。

QwenClaudeAIモデルオープンソースローカルAI推論モデルAlibaba

2026-04-12

訓練の50%を自分でこなすAI — MiniMax M2.7「自己進化」モデルの衝撃

MiniMax M2.7は自身の訓練の30-50%を自律実行する「自己進化」型AI。10Bアクティブパラメータで業界トップ性能、価格は1/50。技術と意味を解説

AIモデルMiniMaxオープンソースLLM

2026-04-12

Phi-4-reasoning — Microsoftが証明した「小さくても賢い」推論モデルの実力

Microsoft Phi-4-reasoningの推論性能・ベンチマーク・ローカル実行方法を解説。14Bパラメータでo3-miniに迫る数学・科学推論の実力とは

AIモデルMicrosoftPhi-4推論モデルオープンソースSLM（小規模言語モデル）

2026-04-11

Cursor Composer 2の正体 — 中国発Kimi K2.5ベース、価格90%減、そして残された問い

Cursor Composer 2はMoonshot AIのKimi K2.5を土台に独自RLで鍛えた自社コーディングモデル。SWE-benchや価格をOpus 4.6/GPT-5.4と比較し、その実力と論争を解説する。

AIコーディングCursorAIモデルコーディングベンチマーク

2026-04-11

Qwen 3.6 Plus — 無料で100万トークン、Opus級ベンチマーク。代償はデータだけか

Alibaba最新のQwen 3.6 Plusは1Mコンテキスト、Claude Opus比18分の1の価格、OpenRouterで無料利用可。ベンチマーク、速度、データ収集の実態を検証する。

QwenAlibabaAIモデルAIコーディングオープンモデル料金

2026-04-10

AMI Labs — 「LLMは行き止まり」と断言するチューリング賞受賞者が、10億ドルで賭けに出た

ヤン・ルカンが設立したAMI Labsは、LLMに代わる「ワールドモデル」を構築するパリ発のAIスタートアップ。$1.03Bの資金調達、JEPAアーキテクチャ、AI業界への影響を解説。

AIリサーチAIモデルAMI LabsLLM速報

Gemini 3.1 Ultra — 200万トークン、ライブ動画分析。Googleが本気で出した最上位モデルの全貌

Google Gemini 3.1 Ultraの全貌を解説。200万トークンのコンテキスト、ライブ動画分析、ネイティブマルチモーダル対応の実力。Proとの違い、料金、活用シーンと注意点を紹介

GeminiGoogleAIモデルマルチモーダル

GoogleGeminiAIモデルLLMマルチモーダル

Gemini 3.1 Flash Lite — 100万トークン処理で「1ドル以下」の衝撃

Google Gemini 3.1 Flash Liteを解説。入力$0.25/100万トークンの超低価格、2.5倍速のレスポンス、Thinking Levels機能の使い方、翻訳・モデレーション・エージェントルーターの活用法を紹介

GPT-5.4 mini & nano — OpenAIが「サブエージェント時代」に向けて弾を込めてきた

OpenAI GPT-5.4 miniとnanoを解説。入力$0.20/100万トークンの超低価格モデルが変えるサブエージェント時代のコスト構造、ベンチマーク、フルモデルとの使い分けを紹介

OpenAIAIモデルLLM速報

xAIGrokAIモデルAIエージェントマルチモーダル

Grok 4.20 — 「4つの頭脳が議論してから答える」AIは、ハルシネーションを終わらせるか

xAIのGrok 4.20を解説。4エージェント合議で業界最高の非ハルシネーション率78%を達成した仕組み、SuperGrok Heavyの16エージェント構成、料金、週次改善アーキテクチャの実態を紹介

KimiMoonshot AIAIモデルオープンソース

Kimi K2.5完全ガイド -- 1兆パラメータMoEモデルが100体AIエージェントを同時に動かす

Moonshot AIのKimi K2.5を徹底解説。1兆パラメータMoE、最大100エージェント並列実行のAgent Swarm、料金、使い方、メリット・デメリットがわかる

LLMMetaAIモデルマルチモーダルMuse Sparkレビュー

Meta Muse Spark — オープンソースの旗手がクローズドに転じた衝撃と、その実力

MetaのクローズドモデルMuse Sparkを実際に触ってレビュー。GPT-5.4・Claude Opus 4.6とのベンチマーク比較、無料で使える理由を解説する