Vibe coding 和 agentic engineering 的界限正在变得比我想象中更模糊
来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-05-06 原文链接: https://simonwillison.net/2026/May/6/code-w-claude-2026/#atom-everything
一句话总结
Simon Willison 坦承,随着 AI 编程 agent 可靠性提升,他已经不再逐行审查其产出的代码,vibe coding 和 agentic engineering 之间的清晰界线正在他自己的实践中逐渐消融——这既令人兴奋也令人不安。
速览
- 两种范式正在融合——即使是强调”负责任使用 AI”的 agentic engineering 从业者,也开始像 vibe coder 一样不再逐行审查代码
- 信任建立机制类似于团队协作——Willison 把 AI agent 视为一个已证明能力的”隔壁团队”,按黑盒方式使用其交付物
- 偏差正常化的风险真实存在——每次模型在无人监督下做对了,都增加了未来在错误时刻过度信任的概率
- 传统代码质量信号已失效——一百个 commit、完善的 README、全覆盖测试的仓库现在半小时即可生成,无法再作为质量判断依据
- “被使用过”比”看起来好”更有价值——真正的质量信号是作者持续使用了两周,而不是表面的工程完善度
- 软件开发生命周期的基础假设已改变——整个上下游流程都建立在”一天产出几百行代码”的前提上,这个前提不再成立
- 设计流程可以承担更大风险——当构建成本大幅下降,犯错成本也随之下降,设计无需追求一次做对
- AI 工具是经验的放大器而非替代品——有 25 年经验的人用 AI 跑得更快,但生产软件本身仍然极其困难
- 普通人仍然需要专业软件公司——大多数人不想 vibecode,他们想买更好更便宜的专业产品
- 企业采购逻辑不变——没人想用未经验证的方案,需要至少两家大企业成功使用六个月才敢冒险
核心内容
Vibe coding 与 agentic engineering 的融合困境
Willison 曾在 2025 年 3 月明确划清两者界线:vibe coding 是不看代码、不关心质量的快速原型方式;agentic engineering 是专业工程师在 AI 辅助下追求高质量生产系统的工作方式。
但现实是,随着 Claude Code 等工具可靠性提升,他发现自己即使在生产级项目中也不再逐行审查代码。“如果你让 Claude Code 构建一个 JSON API 端点——运行 SQL 查询、输出 JSON——它就是会做对。“既然知道它会做对,审查的动力就消失了。
这带来了负罪感:如果没审查代码就用于生产,这算负责任吗?
“隔壁团队”类比:建立对 AI 的信任模型
Willison 找到的心理框架是回忆大型组织中的工作方式。当隔壁团队交付一个图片缩放服务时,你不会去读他们的每一行代码——你看文档,用它,出了问题再去翻 Git 仓库。
他开始以同样方式对待 AI agent。但不适感仍在:人类团队有声誉、有责任感、有”做出垃圾会毁掉职业生涯”的约束。Claude Code 没有职业声誉,也无法承担责任。
然而它一直在证明自己——一次又一次按照他喜欢的风格正确完成任务。
偏差正常化:无声积累的风险
Willison 引用了”偏差正常化”的概念:每次在缺乏监督的情况下模型做出了正确的结果,信任就增加一分。但这种渐进式信任建立的风险在于——你无法知道哪一次会翻车,而到那时你可能已经完全放松了警惕。
代码质量信号的失效与新标准
过去:一百个 commit + 好的 README + 自动化测试 = 作者倾注了心血。 现在:同样的东西半小时就能生成,即使是 Willison 自己的项目,他也无法通过外观分辨质量。
新的判断标准:有人是否真正使用过这个工具。连续使用两周的 vibe coded 项目,比刚生成但未验证的”完美”项目更值得信赖。
瓶颈转移:整个生命周期需要重新设计
当产出从 200 行/天变成 2,000 行/天:
- 下游:测试、部署、运维流程是否能承受 10 倍代码量?
- 上游:Anthropic 设计负责人 Jenny Wen 指出,设计流程存在的原因是”交付给工程师后三个月构建错误的东西是灾难”。当构建成本趋近于零,设计可以更大胆、更迭代、更容错。
职业前景:放大器而非替代品
Willison 不担心自己的职业生涯,理由是:
- 他与 agent 的对话对大多数人来说是”天书”
- AI 工具放大已有经验,知道在做什么的人能跑得更快
- 生产软件仍然极其困难,所有 AI 工具也无法改变这一事实
- 引用 Matthew Yglesias 的话:大多数人不想自己 vibecode,他们想要专业公司卖给他们更好更便宜的产品——就像你可以看 YouTube 学修水管,但你宁愿雇水管工
名言金句
- “如果你只是更快地产出低质量的东西,我认为那很糟糕。我想要的是更快地构建更高质量的东西。”
- “Claude Code 没有职业声誉!它无法为自己所做的事情承担责任。但它一直在证明自己。”
- “我不想用你那个 CRM,除非至少有两家大企业已经成功用了六个月。”
- “生产软件是一件极其困难的事情。你可以给我世界上所有的 AI 工具,我们想要实现的事情仍然非常困难。”
- “五个月过去了,我不想 vibecode——我想要专业管理的软件公司使用 AI 编程辅助工具来为我制造更多/更好/更便宜的软件产品。” —— Matthew Yglesias
可行建议
- 建立”使用验证”机制:对 AI 生成的代码,持续使用两周再推向生产,比逐行审查更实际
- 意识到偏差正常化:定期强制自己对 AI 产出做深度审查,打破”每次都对所以不用看”的惯性
- 重新评估质量信号:不再以 commit 数、测试覆盖率作为唯一标准,增加”实际使用时长”和”经历过的 edge case”作为判断维度
- 调整设计流程:当构建成本下降时,允许设计更具探索性,用快速原型替代冗长的前期设计
- 承认新的信任模型:像对待”隔壁团队”一样对待 AI agent——信任但验证,出问题再深究
资源清单
- Ep. #9, The AI Coding Paradigm Shift with Simon Willison — Heavybit High Leverage 播客原集
- Not all AI-assisted programming is vibe coding — Willison 对 vibe coding 的初始定义
- Agentic Engineering Patterns — Willison 的 agentic engineering 指南
- Don’t Trust the Process — Jenny Wen (Anthropic) 关于设计流程变革的演讲
- Normalization of Deviance — 偏差正常化概念讨论