AIの出力を「原始人語」に変えたら、トークン消費が65%減った — Cavemanの仕組みと実効性

Claude Codeを使っていると、回答が丁寧すぎると感じることがある。

「このReactコンポーネントが再レンダリングされる原因は、おそらくレンダリングごとに新しいオブジェクト参照が生成されているためです。インラインオブジェクトをpropsとして渡すと、Reactのシャロー比較では毎回異なるオブジェクトとして認識され、再レンダリングがトリガーされます。useMemoを使ってオブジェクトをメモ化することをお勧めします。」

これがCavemanを通すと、こうなる。

「毎レンダーで新参照。inline prop = 新ref = 再render。useMemoで包む。」

情報は同じ。消えたのは丁寧語と接続詞だけだ。

GitHubで78,000スター

Cavemanはオーストリアの開発者Julius Brusseeが作ったオープンソースのClaude Codeスキルで、AIの出力を「原始人語」に変換してトークン消費を削減する。タグラインの「why use many token when few token do trick」がすべてを物語っている。

2026年前半にGitHubで爆発的に広まり、現在78,000以上のスターを獲得。日本のエンジニアコミュニティでもQiitaやZennで「原始人モード」として話題になった。日本語特化のフォーク「genshijin」まで登場している。

導入は30秒

インストールはワンライナーで完了する。

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Node.js 18以降が必要。インストーラーがマシン上のAIコーディングエージェントを自動検出し、スキルファイルを配置する。Claude Codeだけでなく、Codex、Cursor、Windsurf、Cline、Copilot、Gemini CLIなど30以上のツールに対応している。

導入後は /caveman と打つだけでモードが切り替わる。

4段階の圧縮レベル

用途に応じて圧縮の強さを選べる。

レベル	内容	削減率の目安
lite	フィラーワード（「〜だと思います」等）だけ除去	20〜30%
full	デフォルト。原始人モード	50〜65%
ultra	電報スタイル。助詞も省略	65〜75%
wenyan	漢文モード。最短	75%以上

fullが最も実用的なバランスだと感じる。ultraになると人間が読むには少し辛くなるが、エージェント間のやり取り（サブエージェントからの報告など）ならultraでも問題ない。

補助コマンドも用意されている。/caveman-commit でコミットメッセージを50文字以内に圧縮、/caveman-review でPRレビューを一行に凝縮、/caveman-stats でセッションのトークン消費量と累積節約量を表示。/caveman-compress はメモリファイル自体を書き換えて、入力トークンも約46%削減する。

実際どのくらい節約できるのか

ここは期待値の調整が必要だ。

公式ベンチマークでは10のテストケースで平均65%の出力削減を謳っている。これは事実だが、「出力トークン」に限った話である。AIコーディングセッション全体で見ると、出力は全トークン消費の約25%に過ぎない。残りはコード読み込みやコンテキストウィンドウへの入力が占める。

つまり、セッション全体での実質的な節約率は4〜10%程度というのが現実的な数字だ。

それでも、月に数百万トークンを消費するチームなら月額数千円〜数万円のコスト削減になる。個人のClaude Codeユーザーなら、同じクレジットでより多くの作業をこなせるようになる。無料で導入できることを考えれば、投資対効果は悪くない。

なぜ「原始人語」で精度が落ちないのか

2026年3月の論文「Brevity Constraints Reverse Performance Hierarchies in Language Models」が興味深い知見を示している。大規模言語モデルに「短く答えろ」と制約をかけると、特定のベンチマークで精度が26ポイント向上したという結果だ。

直感に反するが、説明はシンプルだ。冗長な回答を生成する過程でモデルは「次に何を言うか」に計算リソースを割いている。そのリソースが「何を答えるか」に集中すれば、本質的な回答の質は上がりうる。Cavemanが技術的な正確性を損なわないのも、同じメカニズムで説明できる。

「丁寧さ」を諦められるか

Cavemanの最大の障壁は、技術的な問題ではなく心理的なものだろう。AIの丁寧な説明に慣れていると、ぶっきらぼうな原始人語は最初は居心地が悪い。

ただ、考えてみれば開発者が本当に必要としているのは「正しいコード」と「的確な指摘」であって、「お勧めします」という丁寧語ではない。Cavemanはその当たり前の事実を、トークン消費量という数字で可視化してくれる。

Claude Code、Cursor、Codexのどれを使っていても導入できる。試してみて合わなければ /caveman off で元に戻るだけだ。

AIの出力を「原始人語」に変えたら、トークン消費が65%減った — Cavemanの仕組みと実効性

GitHubで78,000スター

導入は30秒

4段階の圧縮レベル

実際どのくらい節約できるのか

なぜ「原始人語」で精度が落ちないのか

「丁寧さ」を諦められるか

関連記事

大規模コードベースに放り込まれたときの「最初の1手」— Understand-Anythingが解決すること

「AIデスクトップ」を自分で作る — OSSのWandeskがClaude CodeもCodexもまとめて1つの画面に載せた

AIコーディングエージェントに「今はファイルを触るな」と教える — Statewrightのステートマシン式ガードレール