# LLM

6件の記事

2026-04-08

Claude Opus 4.6を1ヶ月使った所感 — 100万トークンとエージェントチームの実力

!Claude Opus 4.6(/images/posts/claude-opus-4-6-anthropic.png) Anthropicが2月5日にリリースしたClaude Opus 4.6を、約2ヶ月間、主に開発業務とリサーチで使い込んできた。率直に言って、コーディング用途ではこれが現時点のベストだと思って

LLMAnthropicclaudeAIコーディングレビュー

2026-04-08

DeepSeek V4が示す新しい勢力図 — 1兆パラメータ、Huaweiチップ、$0.30/Mトークンの衝撃

!DeepSeek V4(/images/posts/deepseek-v4-multimodal.jpg) DeepSeekがまた市場を揺らす。今度は1兆パラメータだ。 2026年4月、中国のAIスタートアップDeepSeek(https://www.deepseek.com/)が次世代モデル「DeepSeek

LLMDeepSeekマルチモーダル速報

2026-04-08

Gemini 3.1 Pro — 推論性能2倍、価格据え置き。Googleが仕掛けた静かな逆転劇

!Gemini 3.1 Pro(/images/posts/gemini-3-1-pro-google-ai.png) ARC-AGI-2で77.1%。この数字がGemini 3.1 Proの立ち位置を端的に物語っている。Claude Opus 4.6が68.8%、GPT-5.2が52.9%。推論ベンチマークで、G

LLMGooglegeminiai-modelbenchmark

2026-04-08

GPT-5.4が来た — OpenAIの最新モデルは「速さ」と「深さ」を両取りしにきた

GPT-4oからGPT-5、そしてGPT-5.4。たった1年半で、OpenAIのフラッグシップモデルは3世代を駆け抜けた。2024年秋に「GPT-5はいつ出るんだ」と苛立っていた頃が遠い昔のようだ。2026年3月5日にリリースされたGPT-5.4は、前世代のGPT-5.2から約半年での更新。OpenAIの開発サイクル

LLMOpenAI速報コンピュータ操作推論モデル

2026-04-08

Mistral Small 4とVoxtral TTS — フランスのAI企業が「ローカルで動く音声AI」で勝負に出た

!Mistral AI(/images/posts/mistral-small4-voxtral-tts.png) OpenAI、Anthropic、Googleの3強が支配するLLM市場で、フランスのMistral AIが独自の路線を走り続けている。彼らの武器は「オープンウェイト」と「効率性」だ。 2026年に

LLMオープンソースAI音声Mistral

2026-04-08

3つのAIに同時に聞く — Perplexity「Model Council」が検索の正解率を変える

!Perplexity Model Council(/images/posts/perplexity-model-council.png) 「このAIの回答、本当に正しいのか？」 AIに調べ物を任せるようになって、多くの人が感じている不安はこれだろう。ChatGPTに聞いた答えとClaudeに聞いた答えが違う。G

ai-searchperplexityLLMproductivity