2026-04-12LMArena — 3500万人が「AIの実力」をブラインドで裁く、評価額2500億円の審判台LMArena(旧Chatbot Arena)は300以上のAIモデルをブラインドテストで人間が評価するプラットフォーム。Eloレーティングの仕組み、商業化の背景、ベンチマークとしての限界を解説する。LMArenaLLMAIベンチマーク速報