Vibe coding 和 agentic engineering 正在变得比我预想的更接近
来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-05-06 原文链接: https://simonwillison.net/2026/May/6/vibe-coding-and-agentic-engineering/
一句话总结
随着 AI 编程 agent 越来越可靠,Simon Willison 发现自己曾经坚持的 “vibe coding”(随意编程)与 “agentic engineering”(专业 AI 辅助编程)之间的严格界限正在模糊——他不再逐行审查 agent 写的代码了,这让他既兴奋又不安。
速览
- Vibe coding 与 agentic engineering 正在融合——随着 agent 可靠性提升,即使是专业工程师也开始跳过代码审查,两种模式的边界正在消失
- “用过”比”写得好”更有价值——AI 能在半小时内生成看起来完美的项目,真正的质量信号不再是代码本身,而是实际使用时长
- 偏差正常化的风险——每次 agent 在无监督下正确完成任务,都在增加未来错误时刻过度信任的风险
- 软件开发生命周期的整体假设被颠覆——不仅下游(测试、部署)受影响,上游(设计流程)也需要根本性重构
- 设计流程可以更冒险了——当构建成本从三个月变为几天,犯错的代价大幅降低,设计流程不必那么保守
- AI 是经验的放大器——拥有深厚经验的工程师用 AI 工具获益最大,门槛并未消失
- SaaS 不会被自建方案取代——企业需要经过验证的解决方案,就像个人需要”用过两周”的工具一样
核心内容
Vibe coding 与 agentic engineering 的边界正在瓦解
Simon 曾经在 2025 年 3 月明确划出了分界线:vibe coding 是不看代码、祈祷能用的方式,适合个人工具;agentic engineering 是专业工程师利用 AI 辅助、依然对质量负责的方式。
但现在他发现自己已经不再逐行审查 Claude Code 写的代码了。他知道让 Claude Code 构建一个运行 SQL 查询的 JSON API 端点,它就是会正确完成——不会搞砸。于是他开始像对待大公司里另一个团队的交付物那样对待 agent 的输出:看文档、用起来、出问题再查代码。
这让他感到不安,因为人类团队有职业声誉作为质量担保,而 Claude Code 没有。但它一直在用正确的方式、他喜欢的风格完成工作。
偏差正常化——信任的危险积累
Simon 指出这里存在”偏差正常化”的风险模式:每一次 agent 在无人审查的情况下做对了,都在悄悄抬高信任阈值。问题不在于它今天做对了,而在于当它终于做错的那一刻,你已经放松了警惕。
“用过”成为新的质量信号
AI 可以在半小时内生成一个有一百个 commit、漂亮 readme、全面测试的 GitHub 仓库——从外表完全无法区分它是精心打造还是随手吐出。Simon 的新标准是:有人真正使用过这个东西吗?一个每天使用了两周的 vibe coded 项目,比一个刚生成出来没怎么验证的项目有价值得多。
瓶颈从编码转移到整个生命周期
当代码产出从每天 200 行变成 2000 行,整个围绕”编码慢”这个假设构建的软件开发流程都需要重新审视。Jenny Wen(Anthropic 设计负责人)指出:复杂的设计流程存在的前提是”工程实现很贵”,当实现成本大幅降低,设计流程可以承受更多试错。
AI 工具是经验放大器,不是经验替代品
Simon 看自己和 agent 的对话记录,对普通人来说完全是天书。这些工具放大已有经验,而不是消除门槛。生产软件本身仍然极其困难。Matthew Yglesias 的比喻很贴切:你可以看 YouTube 学修水管,但你更想请专业水管工。
SaaS 和经过验证的软件仍有价值
企业版的”用过”标准是:我不想要一个 CRM,除非至少两家大型企业已经成功使用了六个月。即使 AI 让自建变得更容易,人们仍然想要经过验证能用的解决方案。
名言金句
-
“The goal is to build high quality production systems: if you’re building lower quality stuff faster, I think that’s bad. I want to build higher quality stuff faster.”
-
“Claude Code does not have a professional reputation! It can’t take accountability for what it’s done. But it’s been proving itself anyway.”
-
“What I value more than the quality of the tests and documentation is that I want somebody to have used the thing.”
-
“The entire software development lifecycle was, it turns out, designed around the idea that it takes a day to produce a few hundred lines of code. And now it doesn’t.”
-
“I can plumb my house if I watch enough YouTube videos on plumbing. I would rather hire a plumber.”
可行建议
- 建立 agent 输出的验证机制:不要依赖代码审查,而是通过实际使用和自动化测试来验证 agent 产出的质量
- 重新定义”质量信号”:从代码外观(commit 数、测试覆盖率)转向使用时长和实际验证
- 重构设计流程:既然构建成本降低了,让设计流程更快速、更允许试错,用原型替代冗长的规格说明
- 保持对偏差正常化的警觉:定期抽查 agent 代码,不要因为连续成功就完全放松监控
资源清单
- Heavybit High Leverage Ep. #9 播客
- Not all AI-assisted programming is vibe coding — Simon 2025 年的原始分类文章
- Agentic engineering 指南
- The normalization of deviance
- Jenny Wen: Don’t Trust the Process — Anthropic 设计负责人谈设计流程变革