返回文章列表

2026-05-20

写了 Skill 还是不稳定?这套写法让 Agent 真正学会判断

很多人写 Codex / Claude Code 的 Skill,第一反应就是写流程。 第一步做什么。 第二步检查什么。 第三步输出什么文件。 看起来很完整,实际一跑就知道问题在哪:Agent 确实照着做了,但做出来的东西还是不稳。 选题 Skill 会选一堆通稿。 标题 Skill 会给你加“重磅”“炸裂”“必看”…

很多人写 Codex / Claude Code 的 Skill,第一反应就是写流程。

第一步做什么。

第二步检查什么。

第三步输出什么文件。

看起来很完整,实际一跑就知道问题在哪:Agent 确实照着做了,但做出来的东西还是不稳。

选题 Skill 会选一堆通稿。

标题 Skill 会给你加“重磅”“炸裂”“必看”。

审稿 Skill 看起来过了一遍,真正的废话、空句、标题党,照样留在正文里。

这不是 Agent 不听话。

是 Skill 只告诉它“要做什么”,没告诉它“什么叫好”。

Skill 不是提示词,是一套可复用的经验包

我这两天重新看了一圈官方文档、社区项目和我们自己翻车的稿子,最大的感受是:好的 Skill 不是把步骤写满,而是把专家判断封进去。

提示词解决的是这一次怎么做。

Skill 解决的是以后遇到同类任务,Agent 能不能稳定按同一套标准做。

这两个东西完全不是一回事。

如果你只是写:

请帮我起 5 个标题,要求有点击率。

Agent 大概率会给你这种:

重磅!这个工具彻底改变 AI 工作流

看起来有情绪,实际啥也没说。

但如果 Skill 里写清楚:

标题必须让读者第一眼看出:
1. 这和谁有关
2. 解决什么痛点
3. 看完能拿走什么
4. 标题承诺必须能被正文兑现

再给它好坏案例,结果就会稳定很多。

同样是写 Skill,差别就在这里。

一个是在命令 Agent。

一个是在训练 Agent 的判断。

Skill 不是流程,是判断标准

第一块:先写触发边界,别让 Skill 乱上场

很多 Skill 第一行就开始写流程,这是很危险的。

因为 Agent 最常犯的错,不是不会执行,而是不知道什么时候该用这套能力

比如写一个“选题 Skill”,不能只写:

从热榜里选 3 个 AI 相关话题。

这样它会把所有 AI 新闻都当候选,最后选出来一堆大家都看过的通稿。

更好的写法是先把边界写清楚:

适用场景:
- 需要为公众号、头条、Twitter 找 AI 工具/教程/工作流选题
- 目标是让读者读完能立刻用上、收藏或转发

不适用场景:
- 只有行业新闻,没有用户收益
- 只有模型参数变化,没有实际使用路径
- 之前已经写过,除非出现新的角度或官方更新

这段看起来普通,但非常关键。

它会把 Agent 从“看到热点就写”,拉回到“这篇对读者有没有用”。

第二块:把好坏标准写具体

Skill 里最值钱的不是步骤,是标准。

你不能只写“标题要有吸引力”。

什么叫有吸引力?

是有数字?

是有情绪?

是有免费?

是击中某类用户的痛点?

这些不写清楚,Agent 只能按自己最熟的套路来。

我们这次标题就翻过一次车。

原来写成:

写了 Skill 还是不稳定?补齐这 10 个组件,Agent 才能真正干活

第一眼看是猛的,但它有个硬伤:正文根本没写 10 个组件。

这就是标题党。

不是“标题技巧”,是信任透支。

后来改成:

别再把 Skill 写成流程清单了,Agent 真正缺的是判断标准

这个标题没那么花,但正文能兑现。

文章讲的就是:Skill 不能只写流程,要写触发边界、判断标准、案例对照、工程闭环和验证场景。

标题承诺什么,正文就交付什么。

这条要写进 Skill 里。

否则 Agent 很容易为了点击率硬造数字、硬造清单、硬造结论。

第三块:一定要放好坏案例

只写规则,Agent 很难学会品味。

好坏案例才是最省 token 的训练方式。

比如你想让 Agent 学会判断标题,不要只写:

标题要具体,标题要有价值感,标题要避免 AI 味。

这三句话都对。

但没用。

你要直接给它看对照。

弱标题:
国产 Agent 工具链终于补上手脚

问题:
太抽象,看不出读者能拿走什么。

更好的标题:
Kimi 也能操作网页了,国产 Agent 开始干浏览器里的活

为什么更好:
对象明确,动作明确,读者知道这不是普通模型新闻,而是能进入真实工作流的能力变化。

这种案例放三五组,比写一堆“标题原则”更有用。

因为 Agent 不是缺流程。

它缺的是这种“哦,原来这叫好”的参照物。

写作 Skill、选题 Skill、审稿 Skill、产品判断 Skill 都一样。

只要是靠经验和品味的活,都必须有案例。

没有案例的 Skill,最后大概率会变成一份礼貌但无力的操作手册。

第四块:机械检查交给脚本,别塞进正文

还有一种 Skill 写法也很常见:把所有东西都写进 SKILL.md

标题怎么写。

图片比例多少。

公众号摘要有没有。

头条位置选不选北京。

发布后链接回填到哪里。

这些当然重要,但它们不是同一类东西。

经验判断应该写进 Skill。

机械检查应该交给脚本。

比如:

封面图必须存在
头条封面比例必须是 16:9
公众号摘要不能为空
Twitter 线程配置必须有图片

这些不要靠 Agent 记。

直接写 validator。

没通过就挡住发布。

Skill 负责告诉 Agent 为什么这样做、什么时候这样做、什么结果算好。

脚本负责挡住低级错误。

这两个分开之后,Skill 会清爽很多,Agent 也不容易被一堆机械规则淹没。

第五块:给它真实翻车场景

最好的 Skill,不是从理论里写出来的,是从翻车里长出来的。

比如我之前写过一个选题 Skill,只写了“从热榜里挑 AI 相关内容”。

结果它真的很听话。

每天都能挑出 AI 相关内容。

但大部分都是普通新闻,读者看完没有任何行动价值。

后面我才把这条翻车场景写进去:

坏案例:
只因为某条 AI 新闻热,就把它当长文选题。

为什么坏:
它只有信息差,没有读者收益。读者看完不知道能省什么、学什么、避开什么坑。

正确处理:
这类题只适合发短动态。除非能拆出具体教程、工具入口、实操路径或成本变化,否则不要写成长文。

这比单独写一句“选题要有价值”有效得多。

因为它有具体场景。

Agent 下次遇到同类问题,就能知道这不是抽象原则,而是真翻过车的地方。

一份行业经验型 Skill,可以按这个骨架写

如果你现在要写一个真正能复用的 Skill,可以先别急着写流程。

先按这个骨架搭:

1. 这个 Skill 解决什么问题
2. 什么时候该用,什么时候不该用
3. 这件事的核心判断是什么
4. 什么算好,什么算差
5. 好案例和坏案例
6. 不同场景下怎么变形
7. 哪些错误一出现就打回
8. 哪些机械检查交给脚本
9. 用什么翻车场景验证它真的生效

这不是固定模板。

但它能避免一个最大的问题:把 Skill 写成流程清单。

流程清单只能让 Agent “做完”。

判断标准才能让 Agent “做好”。

以后我们写 Skill,真正要追求的不是“步骤越来越完整”,而是“Agent 越来越像懂这个领域的人”。

这才是 Skill 最值钱的地方。

关注我,继续聊 AI 工具和 Agent 工作流。大小项目开发和方案咨询,都可以私信。