Yuan的博客
EN

如何使用 Claude Code 生成更高质量的代码

大多数开发者的工作流程是:输入提示词,偶尔使用计划模式,修复错误,然后重复。两种情况下的结果都是一团糟,稍微复杂一点的任务就完全崩溃。

这个技能强制执行一套严格的流程,将思考与编码分离

调研 -> 规划 -> 标注(重复 1-6 次) -> 待办清单 -> 实现 -> 反馈

如果你想生成更高质量、更符合目标的代码,你应该使用这个技能。

接下来,让我们看看它在实际场景中的表现。以下是测试结果及其分析。

实验

在同一代码库上运行了三个任务,对比使用技能和不使用技能的效果。

  • 实验 1:添加全面的错误处理(跨模块,涉及 5+ 个文件)
  • 实验 2:为耗时操作添加缓存(中等复杂度,涉及 2 个文件)
  • 实验 3:修复不稳定的测试(调试类,涉及 1-2 个文件)

代码质量

指标实验 1实验 2实验 3
读写比使用7.04.34.5
未使用1.01.43.5
探索广度使用14139
未使用1356
回退次数使用000
未使用000
断言通过使用5/55/55/5

读写比是指 Agent 读取的文件数量与修改的文件数量之比。可以理解为"在动手写代码之前做了多少功课"。使用技能时,比率稳定在 4-7 倍——它在修改任何内容之前都会大量阅读。而不使用技能时,实验 1 的比率降到了 1:1,意味着 Agent 一边读文件一边就开始修改了。这就好比还没理解系统就开始写代码。

探索广度统计的是在写入任何代码之前发生了多少次 Read/Glob/Grep 调用。看实验 2——使用技能的 Agent 进行了 13 次探索调用,而未使用技能的 Agent 只进行了 5 次。这意味着未使用技能的 Agent 跳过了检查代码库中是否已存在缓存模式。它运气好,确实没有现成的缓存,但它从未真正验证过这一点。

回退次数统计 Agent 需要撤销自身工作的次数。全部为零——使用技能后每次都能一次做对。

断言通过是针对特定任务的质量检查,例如"是否在规划之前进行了调研?“以及"是否基于现有模式构建而非重复造轮子?“15 项中 15 项全部通过。

流程效率

指标实验 1实验 2实验 3
轮次使用192322
未使用371821
增量编辑使用000
未使用1152
总 Token 数使用279,745483,916387,964
未使用1,091,610311,806433,598

轮次是 Agent 需要的来回交互次数。在实验 1 中,未使用技能的 Agent 用了 37 轮——它不断来回尝试、修复、再尝试。而使用技能的 Agent 只用了 19 轮,因为调研阶段从源头上避免了错误方向。

增量编辑是最关键的指标。它统计 Agent 对源文件进行了多少次单独的 Edit 调用。使用技能时,每次都是零——在计划被批准之前不会写任何代码,然后一次性协调完成所有修改。而未使用技能时,实验 1 出现了 11 次增量编辑。这意味着 Agent 在逐块修补代码,以试错的方式通过反复的小修复来逐步构建实现,而不是从计划出发一次做对。

总 Token 数是原始成本。实验 1 的对比最为明显:先深入思考再编码节省了 74% 的 Token,因为避免了所有返工。实验 2 则相反——使用技能消耗了更多 Token,因为它探索得更彻底。但这些额外的 Token 用于检查缓存是否已经存在,而这正是在向代码库引入新模式之前你希望进行的检查。


使用方法

安装

# 克隆仓库到临时位置
git clone https://github.com/meatballG1210/code-flow.git

# 在你的项目中创建技能目录
mkdir -p .claude/skills

# 移动到技能文件夹
mv code-flow .claude/skills/

就这样。Claude Code 会自动从 .claude/skills/ 目录加载技能。

如何使用

当你要求进行多文件修改、架构重构、新功能开发、性能优化,或任何可能与现有代码模式冲突的操作时,该技能会自动触发。只需正常描述你的任务即可:

添加缓存以提升性能

你也可以通过 /code-flow 显式触发:

/code-flow 重构错误处理系统

无论哪种方式,技能都会引导你逐步完成每个阶段——调研、规划、标注、待办、实现、反馈。它会在每个关卡停下来等待你的审核,然后再继续。跟着提示操作即可。