Cost-aware Model/Role Split — "强推理者 + 廉价执行者" 一句话:一条多次调用 LM 的工作流里, 少数调用需要推理,多数调用是机械执行 。让一个强模型做决策,让一个便宜模型干活——按认知负荷拆分,不是按"哪个更准"拆分。 统一声明 :Phase B 发现这个模式在 4 个 SOP 里以 4 个名字反复出现——DSPy 的 optimizer-LM vs task-LM、Aider 的 architect+editor、vLLM 的 speculative draft+target、LangGraph 的 supervisor+worker。它们是 同一个形状 。本技能把这个形状抽出来,命名为 cost-tiered models。详见 §7 跨框架对照。 --- 1. 何时激活 (When to activate) 任一情形成立时激活本技能: - 工作流会 对 LM 发起多次调用 ,且这些调用 认知负荷不均 ——有的需要规划/推理/判断,有的只是改写、抽取、格式化、应用一个已定好的决定。 - 你正在为一条 LM 流水线 选模型 ,并且默认想"全程用同一个最强模型"——这是本技能要挑战的反射。 - 你有一个 强 reasoner 但执行差 的模型(典型:o1/o3 推理强但编辑代码格式脏),需要给它配一个干净的执行者。 - 你在 成本/延迟压力 下…