darwin-skill — Skillopedia

Darwin Skill 2.0 v2.0 · 2026-05-28 — 吸收 Microsoft Research SkillLens（arXiv 2605.23899）的 9 维评分药方 + SkillOpt（arXiv 2605.23904）的 validation-gated 验证机制 + human in the loop 三层守关。借鉴 Karpathy autoresearch 的自主实验循环，对 skills 进行持续优化。核心理念：评估 → 改进 → 实测验证 → 人类确认 → 保留或回滚 → 生成成果卡片 GitHub: https://github.com/alchaincyf/darwin-skill --- 设计哲学 autoresearch 的精髓： 1. 单一可编辑资产 — 每次只改一个 SKILL.md 2. 双重评估 — 结构评分（静态分析）+ 效果验证（跑测试看输出） 3. 棘轮机制 — 只保留改进，自动回滚退步 4. 独立评分 — 评分用子agent，避免「自己改自己评」的偏差 5. 人在回路 — 每个skill优化完后暂停，用户确认再继续与纯结构审查的区别：不只看 SKILL.md 写得规不规范，更看改完后实际跑出来的效果是否更好。 --- 评估 Rubric（9维度，总分100）设计依据：基于 SkillLens 论文（a…