skill-creator

AI 智能 社区 @anthropics
信任分
88/100
兼容 Agent
1
速查档案 只列事实:领域、Agent、信任分、作者、原文章节。装与不装请看下方作者解读。
领域
AI 智能
兼容 Agent
Claude Code
信任分
88 / 100 · 社区维护
作者 / 版本 / 许可
@anthropics · 未声明 license
安装命令数
1 条

需要注意: 未限定 allowed-tools,默认拥有全部工具权限。

想读作者英文原文? ↓ 滚到正文区切换 · 在 GitHub 查看 ↗

解读由编辑根据原文凝练而成,命令、链接、术语均与作者原文一致;想看完整论述请切到右侧

skill-creator 是「写一个新 skill 并迭代到能用」的元技能——它的使命不是替你想清楚要做什么,而是把「想 → 写草稿 → 起测试 → 跑评估 → 据结果重写」这条循环走顺,并保留人参与判断的余地。

设计思路

作者把 skill 的开发当成一种特殊的产品迭代:先有一个粗的目标,然后用 prompts 当回归测试集,把「这个 skill 是不是真的让 Claude 干那件事」的反馈变成可以反复跑的实验,而不是「我感觉行了」。

工作流

高层流程作者写得很直白:① 决定 skill 要做什么、大致怎么做;② 写草稿;③ 起几个测试 prompt 让接了 skill 的 Claude 跑;④ 帮用户做定性 + 定量评估——后台跑 prompt 时趁机起草 quantitative evals(已有就解释或微调),然后用 eval-viewer/generate_review.py 让用户看结果,并对照定量指标;⑤ 据用户反馈与定量短板重写 skill;⑥ 满意了就扩大测试集再来一遍。技能本身要先判断用户处在哪个阶段——刚有想法?已有草稿?干脆只想 vibe-coding?——再跳进去帮他。

评估纪律

即便用户说「不用一堆评估了,跟我 vibe」,技能也允许,但默认会鼓励「至少跑一遍」;skill 改完后再用 description optimizer 脚本优化触发措辞,这是 skill 上线前的最后一道质检。

与用户沟通

作者特意提示:用 skill-creator 的人编程熟练度差异极大——别堆术语,按对方的水平讲清楚每一步在做什么、为什么要做。

适合的场景

  • 第一次写一个 Claude skill,需要一个能引导自己的元 skill
  • 已经有草稿,想做对比评测决定要不要发布
  • 重写老 skill 时希望有「测试集 + 定量评估」做安全网

何时不要用

  • 单次性 prompt 改造不必走 skill 化(评估成本高于收益)
  • 仓库里已经有更专门的 writing-skills 流程:那个偏写作风格,本技能偏全流程

配套

writing-skills(怎么用更精炼的写作语调写 SKILL.md)、template-skill(拿现成模板起一个)、subagent-driven-development(让 subagent 帮你跑测试 prompt)。