Claude Code v2.1.100以降、トークン消費が急増:cache_creation膨張の原因と回避策
AI開発環境「Claude Code」のバージョンがv2.1.100以降に更新された結果、ユーザーが同一のCLAUDE.mdファイルを使用しているにもかかわらず、トークン消費量が約40%増加しているという問題が報告されています。これは単なる体感ではなく、具体的な計測データに基づいた事実です。GitHub Issue #46917によると、以前のバージョンv2.1.98では`cache_creation_input_tokens`が49,726トークンであったのに対し、v2.1.100では69,922トークンに膨張しています。この増加は、ペイロードや使用するCLAUDE.mdが同一であるにもかかわらず、サーバー側で何らかの変更があったことを示唆しています。
この膨張は、特にコスト面で大きな影響を及ぼします。`cache_creation`は`cache_read`の約4倍のコストがかかるため、コスト面での圧迫が深刻です。また、20,000トークンもの追加のデータがコンテキストウィンドウを圧迫し、同じ作業でもクォータが早く尽きるという体感的な問題を引き起こしています。
一時的な回避策として、最も効果的とされているのは、バージョンを膨張が報告される前のv2.1.98に固定することです。ただし、この方法はセキュリティパッチも固定してしまうため、長期的な解決策ではありません。また、APIを直接利用する場合はこの影響を受けません。ユーザーは、`/cost`コマンドで`cache_creation_input_tokens`と`cache_read_input_tokens`を比較し、`cache_creation`が著しく高い場合に影響を受けていると判断できます。さらに、バージョンに関わらず、トークン消費を監視するカスタムのhookを設定することで、異常な膨張を検知する仕組みを構築することも可能です。記事は、この問題がClaude Codeにおけるトークン消費の複数の異常(例:キャッシュTTLのサイレント変更、システムプロンプトキャッシュの増加)の一つであり、体系的な対策としてCLAUDE.mdの最適化やコンテキスト管理が重要であると締めくくっています。
背景
AI開発環境「Claude Code」は、大規模言語モデル(LLM)の利用効率を向上させるためのツールですが、バージョンアップに伴い、内部的なキャッシュ処理(`cache_creation`)に異常な膨張が発生しています。これは、ユーザーが意図しない形でトークンコストが増加し、利用体験を損なうという、開発者コミュニティにおける共通の課題です。
重要用語解説
- cache_creation_input_tokens: Claude Codeがキャッシュを新しく作成する際に消費されるトークン量。この値が異常に膨張することが、今回の問題の核心です。
- トークン消費: LLMとのやり取りにおいて、入力(プロンプト)や出力(応答)のテキストを単位として計測される量。コストやコンテキストウィンドウの制限に直結します。
- コンテキストウィンドウ: LLMが一度の処理で記憶し、参照できる情報(トークン)の最大容量。この容量が圧迫されると、処理能力が低下します。
- 影響: この問題は、開発者がAIツールを利用する際のコスト予測を困難にし、作業効率の低下を招きます。Anthropic社による迅速な修正パッチのリリースが待たれます。また、ユーザー側でのバージョン固定や監視フックの実装など、一時的かつ技術的な対応が求められています。