Claude Opus 4.6を1ヶ月使った所感 — 100万トークンとエージェントチームの実力
!Claude Opus 4.6(/images/posts/claude-opus-4-6-anthropic.png) Anthropicが2月5日にリリースしたClaude Opus 4.6を、約2ヶ月間、主に開発業務とリサーチで使い込んできた。率直に言って、コーディング用途ではこれが現時点のベストだと思って
6件の記事
!Claude Opus 4.6(/images/posts/claude-opus-4-6-anthropic.png) Anthropicが2月5日にリリースしたClaude Opus 4.6を、約2ヶ月間、主に開発業務とリサーチで使い込んできた。率直に言って、コーディング用途ではこれが現時点のベストだと思って
!DeepSeek V4(/images/posts/deepseek-v4-multimodal.jpg) DeepSeekがまた市場を揺らす。今度は1兆パラメータだ。 2026年4月、中国のAIスタートアップDeepSeek(https://www.deepseek.com/)が次世代モデル「DeepSeek
!Gemini 3.1 Pro(/images/posts/gemini-3-1-pro-google-ai.png) ARC-AGI-2で77.1%。この数字がGemini 3.1 Proの立ち位置を端的に物語っている。Claude Opus 4.6が68.8%、GPT-5.2が52.9%。推論ベンチマークで、G
GPT-4oからGPT-5、そしてGPT-5.4。たった1年半で、OpenAIのフラッグシップモデルは3世代を駆け抜けた。2024年秋に「GPT-5はいつ出るんだ」と苛立っていた頃が遠い昔のようだ。2026年3月5日にリリースされたGPT-5.4は、前世代のGPT-5.2から約半年での更新。OpenAIの開発サイクル
!Mistral AI(/images/posts/mistral-small4-voxtral-tts.png) OpenAI、Anthropic、Googleの3強が支配するLLM市場で、フランスのMistral AIが独自の路線を走り続けている。彼らの武器は「オープンウェイト」と「効率性」だ。 2026年に
!Perplexity Model Council(/images/posts/perplexity-model-council.png) 「このAIの回答、本当に正しいのか?」 AIに調べ物を任せるようになって、多くの人が感じている不安はこれだろう。ChatGPTに聞いた答えとClaudeに聞いた答えが違う。G