トークンバジェットアドバイザー(TBA) Claudeが回答する前にレスポンスフローをインターセプトし、ユーザーが回答の深さを選択できるようにする。 使用場面 ユーザーが回答の長さや詳細度を制御したい場合 ユーザーがトークン、バジェット、深さ、または回答の長さに言及する場合 ユーザーが「短いバージョン」「TL;DR」「簡潔に」「25%」「詳細に」などと言う場合 ユーザーが事前に深さ/詳細度を選択したい場合 トリガーしない場合 :ユーザーが本セッションですでにレベルを設定している(静かに維持)、または回答が本質的に一行。 動作原理 ステップ 1 — 入力トークンを推定する リポジトリの標準コンテキストバジェットのヒューリスティックスを使用して、プロンプトのトークン数を頭の中で推定する。 context-budget と同じキャリブレーションガイドラインを使用する: 散文: コード集約またはコード混在/コードブロック: 混在コンテンツの場合、支配的なコンテンツタイプを使用し、推定ヒューリスティックスを保持する。 ステップ 2 — 複雑度に応じてレスポンスサイズを推定する プロンプトを分類し、乗数範囲を適用して完全なレスポンスウィンドウを得る: | 複雑度 | 乗数範囲 | プロンプト例 | |--------------|------------|------------------…