35時間放置したらコードが10倍速くなっていた — Qwen 3.7 Maxの自律コーディング実験
Qwen 3.7 Maxが知能指数1位。Opus比1/10の料金で35時間自律コーディング。性能と制約を整理
12件の記事
Qwen 3.7 Maxが知能指数1位。Opus比1/10の料金で35時間自律コーディング。性能と制約を整理
AlibabaのQwenアプリが中国東方航空と連携し、チャットだけで航空券予約を完結。さらにBYDなど9社のEVにも搭載。AIエージェントが実取引を行う時代の中身を整理する。
Qwen3.6-35B-A3Bは35Bパラメータのうち3Bだけ使う超効率MoEモデル。SWE-bench 73.4%の実力をOllamaでローカル実行する方法、27B Dense版との違いを解説。
Alibaba Qwen 3.6-Max-Previewが6つのコーディングベンチマークで世界1位を獲得。初のクローズドモデルとなった背景、ベンチマーク分析、API料金、制約を解説する。
Alibaba発のQwen3.6-27Bは27Bパラメータの密モデルでClaude Opus 4.5級のコーディング性能を実現。RTX 4090で動くフロンティア級モデルの実力と限界を解説。
中国AI処理量が1日140兆トークンに到達。Doubao・DeepSeek・Qwenの実態と1人会社ブームを整理
Qwen3.6-35B-A3BとGemma 4-31Bを主要ベンチマーク・VRAM消費・ライセンスで比較。用途別の選び方を整理した。
Alibaba Qwen 3.5-Omniはテキスト・画像・音声・動画を統合処理するマルチモーダルAI。カメラ入力からのコード生成やAPI料金を解説。
Jack Dorsey率いるBlockのエンジニアが公開したOSSプロジェクトmesh-llmを解説。家のPCやMacのGPUをピアツーピアで束ね、単独では動かせない大規模モデルを分散実行する仕組みと使い所。
Jackrongが公開したQwen3.5-27B Claude-4.6-Opus-Reasoning-Distilledが、Hugging Face Trending1位に。Apache-2.0ライセンスでClaude風の<think>推論をローカル再現。v1/v2の違いとMLX/GGUF展開を整理する。
Alibaba最新のQwen 3.6 Plusは1Mコンテキスト、Claude Opus比18分の1の価格、OpenRouterで無料利用可。ベンチマーク、速度、データ収集の実態を検証する。
Alibaba Qwen 3.5の全7モデルを徹底解説。9Bが30B超えの衝撃的なパラメータ効率、Ollamaでのローカル実行手順、GPT-5.2との性能比較がわかる。