Skip to main content

Superpowers 是什么?

· 5 min read

AI Coding 的下半场不是 更强的模型,而是更难违反的流程。

  1. Superpowers 是什么:一套 Claude Code 插件,注入 14 个 skill,强制 5 阶段不可绕过流程。
  2. TDD 硬约束:RED-GREEN-REFACTOR 循环被写进 skill 代码,测试必须先失败才能写实现。
  3. 官方收编信号:Anthropic 一月将其纳入官方插件市场——承认纯灵活无法规模化。
  4. 数据说话:任务完成率 62% → 89%,token 消耗增加 37%。
  5. 版本化管理:skill 是文本文件,可 git 提交、code review——团队第一次能把 AI 写代码的规矩版本化。
  6. 动态 vs 静态:相比 .cursorrules 和 CLAUDE.md,skill 按任务状态精确触发,不打扰无关流程。
  7. 一句话记住把规则写进 skill 代码,不是 prompt 里

问题:模型太聪明,也太爱跳步

用过 Claude Code 的人都有这种体验:你说"先分析再动手",它回"好的",然后直接开始写代码。你让它写测试,它写个 assert(true) 糊弄你。你说"定位根因再修",它扫一眼日志就开始改文件。

不是模型能力不够,是它太急于给你结果。就像一个聪明但毛躁的实习生,你每句话它都点头,转头还是按自己的节奏来。

这个问题用 prompt 解决不了。你在 CLAUDE.md 里写"请先做需求澄清",Claude 读完表示理解,然后该怎么跳步还是怎么跳步。prompt 是建议,不是约束

Superpowers 的解法简单粗暴:不相信模型的自觉,用代码锁死执行路径。

Superpowers 是什么

Superpowers 是 Jesse Vincent(GitHub: obra)开源的一套 Claude Code 插件,安装后向 Claude Code 注入 14 个 skill。核心是强制一个 5 阶段流程:

每个阶段对应一个或多个可执行的 skill,不是"提示词大全",而是工作流模块。举几个关键 skill:

  • brainstorming:强制 Socratic 式提问,把模糊需求磨清楚才能进入下一阶段
  • test-driven-development:检测到实现代码先于测试时直接阻塞,必须走 RED → GREEN → REFACTOR
  • subagent-driven-development:把大任务拆给并行子 Agent,内建 code review 环节
  • systematic-debugging:4 阶段根因分析完成后才允许动手修
  • using-git-worktrees:强制隔离实验分支,不污染主工作区

对一个资深工程师,这些是肌肉记忆。对 AI Agent,过去是"可选的 prompt",现在是 skill 代码层的硬约束。区别在于:prompt 可以被模型绕过去,skill 代码不行。

官方收编意味着什么

2026 年 1 月,Anthropic 把 Superpowers 放进了 Claude Code 官方插件市场。这件事的信号意义比技术本身更大。

Claude Code 原本定位是"灵活、低约束的终端 Agent"。接纳 Superpowers 等同于承认:纯灵活没法规模化,必须给开发者提供开箱即用的工程纪律。

对比三条路线很有意思:

工具方法论实现方式
Claude Code + Superpowers开源插件 + 官方市场,最轻、最易扩展
Cursor Composer 2RL 训练把方法论内化到模型
GitHub CopilotIDE 按钮约束用户行为

Claude Code 选了最轻的路线——方法论不靠训练、不靠 UI 限制,靠可复用的 skill 文件。这意味着社区可以自己造方法论,不用等厂商更新。

两个关键数据

Jesse Vincent 在自己的博客里给了一组数字:

  • 任务完成率:62% → 89%
  • Token 消耗:增加 37%

Superpowers 让每个任务前面多了 2-5 分钟的"规划 thinking",但省下的是反复返工。这个 tradeoff 对大多数实际项目是划算的——修一个上线后的 bug 比多想两分钟贵得多。

注意:89% 不是"模型变强了",是"流程兜住了模型的短板"。

为什么 skill 比 rules file 有用

.cursorrules 是静态规则。CLAUDE.md 也是。你写一条"请先分析再编码",模型在任何时候都能看到,但什么时候该遵守完全靠模型自觉。

Superpowers 的 skill 是动态的。TDD skill 只在开始写新函数时触发,不会在你重构已有代码时跳出来捣乱。systematic-debugging 只在检测到 bug 相关操作时才介入。

这是 rules file 做不到的细粒度控制。本质区别:

  • Rules file:贴在墙上的标语,看不看随你
  • Skill:门禁系统,不刷卡进不去

同一时间还有两个类似项目:GSD(Getting Shit Done)框架主打轻量级计划—执行—验证三步走;gstack 主打 git-centric 工作流。三者的共同底层信念:不再相信模型会自觉做对。这是 2026 年 Q2 AI Coding 最大的叙事转向。

实操建议

如果你已经在用 Claude Code 并且经常遇到 Agent"没澄清就动手""测试写得敷衍""不做根因分析"等问题:

claude /plugin install superpowers@claude-plugins-official

如果你用 Cursor 或 Copilot,可以先读 Jesse Vincent 的方法论博客,把 5 阶段流程的思路移植过去——这些原则是跨工具的。

一句话记住:AI Coding 的下半场不是"更强的模型",而是"更难违反的流程"——把规则写进 skill 代码,而不是 prompt 里。

References

  1. Superpowers GitHub —— Jesse Vincent
  2. Claude Code 插件生态与 Superpowers 深入分析