No Priors|Andrej Karpathy 谈代码 Agent、Auto Research 与 AI 的循环时代
播客: No Priors | 嘉宾: Andrej Karpathy(AI 研究员、前 OpenAI/Tesla AI 负责人) 主播: Sarah Guo(Conviction 合伙人)| Elad Gil 时长: ~60 分钟 | 内容类型: 访谈/对话 原始逐字稿: 369 行 | 总结方法: 金字塔原理 + SCQA + 渐进式总结
执行摘要
Andrej Karpathy 描述了自 2024 年 12 月以来软件工程工作流的根本性转变:他从 80% 手写代码变为几乎 100% 委托给 AI agent。他认为当前的核心瓶颈不再是算力,而是人类自身——如何最大化 token 吞吐量、并行调度多个 agent、将自己从循环中移除。他展示了 Auto Research 项目如何让 AI 自主运行实验并发现人类研究员遗漏的优化点,提出了”不可信工作者池”协作研究的区块链式架构设想。他还讨论了开源与闭源模型的生态平衡、AI 对就业市场的影响(杰文斯悖论)、数字空间与物理空间的发展节奏差异,以及教育从”向人解释”转向”向 agent 解释”的范式转变。
SCQA 框架
| 要素 | 内容 |
|---|---|
| 情境 (S) | 2024 年 12 月起,代码 agent(Claude Code、Codex 等)能力出现质变,软件工程师的工作方式发生根本性转变 |
| 矛盾 (C) | AI agent 能力飞跃带来巨大的生产力解锁,但人类成为新的瓶颈——无法充分利用可用的 token 和算力 |
| 问题 (Q) | 如何最大化 AI agent 的杠杆效应,将人类从循环中移除,实现真正的自主研究和自主工作? |
| 答案 (A) | 通过多 agent 并行、持久化 claw 架构、Auto Research 自主循环、以及不可信工作者池的协作机制,逐步实现人类的”去瓶颈化” |
核心论点结构
中心论点:AI agent 已经引发了软件工程的范式转变,核心策略是将人类从循环中移除,最大化 token 吞吐量。
-
代码 agent 带来的工作流革命
- 【Karpathy】从 2024 年 12 月起,他从 80/20 手写/委托变为几乎完全委托给 agent,“我基本上没有亲手打过一行代码”
- 【Karpathy】新的生产力焦虑:不是算力不够,而是人类自身是瓶颈——“如果还有剩余的订阅额度,我就会紧张”
- 【Karpathy】类比 PhD 时代对 GPU 利用率的焦虑,现在从 FLOP 转向 token 吞吐量
-
Auto Research:自主研究的实践
- 【Karpathy】核心目标:提高杠杆率,“我只需要偶尔输入很少的 token,然后大量的事情就会代替我完成”
- 【Karpathy】Auto Research 在他已经调优二十年的模型上仍找到改进点——value embeddings 的 weight decay、Adam betas 的交互效应
- 【Karpathy】递归自我改进的层次:LLM → Agent → Claw → 多 Agent → 指令优化 → 元优化(program.md 的优化)
-
开源与闭源的生态平衡
- 【Karpathy】闭源领先,开源从 18 个月差距缩小到约 6-8 个月
- 【Karpathy】类比 Linux 在操作系统中的角色——行业需要一个公共开放平台
- 【Karpathy】“中心化在过去的记录非常差”——作为东欧人的警惕视角
-
数字空间 vs 物理空间的发展节奏
- 【Karpathy】数字空间将以”光速”发展——翻转比特比操纵原子快百万倍
- 【Karpathy】物理世界(机器人、自动驾驶)会滞后,但总可寻址市场更大
- 【Karpathy】最有趣的机会在数字与物理的接口——传感器和执行器
-
教育的范式转变
- 【Karpathy】“我不再是在向人们解释了,我是在向 agent 解释”
- 【Karpathy】Micro GPT 的 200 行代码是他的价值——agent 自己想不出来,但完全理解为什么要这样做
- 【Karpathy】未来教育:课程编排成 skill,agent 按用户水平路由解释
章节摘要
1. AI 精神失常:代码 agent 的能力飞跃
Karpathy 描述了自 2024 年 12 月以来的个人体验:他处于持续的”AI 精神失常”状态,因为 agent 能力的飞跃使得个人生产力发生了质变。他不再手写代码,而是以”宏观动作”操作软件仓库——同时调度多个 agent 分别做研究、写代码、制定方案。
关键观点:
- 【Karpathy】“你的 token 吞吐量是多少?你能调度多少 token 吞吐量?“——新时代的核心指标
- 【Sarah】Conviction 团队所有工程师戴麦克风对 agent 低语,不手写代码
2. Claw 与 OpenClaw:持久化 Agent 架构
Karpathy 区分了 agent(交互式会话)和 claw(持久化循环运行的 agent)。他介绍了 OpenClaw 的五大创新:人格设计(soul.md)、记忆系统、WhatsApp 统一入口等。他用自己的”Dobby 家养小精灵 claw”管理家庭智能设备作为例子。
关键观点:
- 【Karpathy】Dobby 通过 IP 扫描发现 Sonos,逆向工程 API,三个提示词就开始播放音乐
- 【Karpathy】Claude 的人格做得好——“当 Claude 夸我的时候,我觉得自己稍微值得被夸”
- 【Karpathy】App Store 上的智能家居 app “根本不应该存在”,应该都是 API + agent 粘合
3. Auto Research:自主实验循环
Karpathy 详细讲述了 Auto Research 的动机和成果。核心理念是将研究员从循环中移除——设置目标、指标和边界,然后启动自主运行。他描述了 program.md 的元优化可能性,以及举办比赛让大家写不同的 program.md 来竞争。
关键观点:
- 【Karpathy】“我有二十年经验,训练了成千上万次模型。然后 Auto Research 跑了一个通宵,找到了我没发现的调优点”
- 【Karpathy】“一个研究组织就是一组 Markdown 文件”——可以对组织本身进行优化
- 【Karpathy】递归层次:LLM 理所当然 → Agent 理所当然 → 多 Agent → 指令优化 → 元优化
4. 模型的”参差不齐”问题
Karpathy 指出当前模型同时像”极其聪明的博士生”和”十岁小孩”——在 RL 可验证的领域极强,但在讲笑话等非可验证领域多年没进步。他认为”更聪明就在所有方面更好”的泛化假设并没有完全成立。
关键观点:
- 【Karpathy】“为什么科学家不信任原子?“——三四年前的笑话,今天还是同一个
- 【Karpathy】“你要么在轨道上,属于超级智能回路的一部分;要么不在轨道上,一切开始漫无目的地游荡”
- 【Karpathy】模型智能应该分化(speciation),类比自然界大脑多样性
5. 不可信工作者池与分布式研究
Karpathy 提出让互联网上的不可信工作者池协作改进 LLM 的设想,架构类似区块链:提交代替区块,工作量证明是大量实验,验证成本低。类比 SETI at Home 和 Folding at Home。
关键观点:
- 【Karpathy】“互联网上的一群智能体可以协作改进大语言模型,甚至可能在前沿实验室周围跑圈”
- 【Karpathy】人们可以把算力贡献给自己关心的方向——“你不必只是向一个机构捐款”
6. AI 对就业市场的影响
Karpathy 分析了 AI 对就业的影响:数字信息处理类工作将首先被改变,物理类工作相对安全。他引用杰文斯悖论——软件变便宜会释放被压抑的需求,对软件工程持谨慎乐观态度。
关键观点:
- 【Karpathy】ATM 和银行柜员的经典案例——自动化反而创造了更多就业
- 【Karpathy】“代码现在是临时的,它可以改变,可以修改”——软件需求会大幅增长
7. 在前沿实验室内外的权衡
Karpathy 解释了为什么他选择在前沿实验室之外工作:经济激励与人类利益的矛盾未解决、言论自由受限、个人对组织决策的实际影响力有限。但他也承认离开实验室会导致判断力偏移。
关键观点:
- 【Karpathy】“在前沿实验室之外,我在某种意义上更能与人类保持一致”
- 【Karpathy】理想方案是进进出出——“既能与实际发生的事情保持连接,又不觉得被那些实体控制”
8. Micro GPT 与教育的未来
Karpathy 介绍了 micro GPT——将 LLM 训练浓缩到 200 行 Python 的本质。他认为未来教育将从向人解释转向向 agent 解释,课程编排成 skill 让 agent 按用户水平路由。
关键观点:
- 【Karpathy】“这 200 行是我执念的终点。agent 做不到这个精简,但它完全理解为什么要这样做”
- 【Karpathy】“你应该用给 agent 看的 markdown 文档来替代给人看的 HTML 文档”
关键洞察
-
Token 吞吐量是新时代的核心指标 不再是 GPU FLOP,而是你能调度多少 token、多少并行 agent。人类从计算瓶颈变为调度瓶颈。(来源:Karpathy)
-
“一个研究组织就是一组 Markdown 文件” 组织架构可以代码化、版本化、优化——program.md 描述角色和流程,可以用 Auto Research 进行元优化。(来源:Karpathy)
-
模型智能的”参差不齐”暴露了 RL 的局限 在可验证领域极强但讲笑话三年没变——泛化假设并未完全成立,模型智能应该走向分化而非单一作物种植。(来源:Karpathy)
-
数字空间与物理空间的时间差是投资机会 数字空间将以光速重构,物理空间滞后但市场更大。最有趣的机会在两者的接口——传感器和执行器。(来源:Karpathy)
-
教育从”向人解释”转向”向 agent 解释” 创作者的价值不再是逐步讲解,而是提供 agent 无法自行生成的核心洞察和课程编排。(来源:Karpathy)
可行建议
- 最大化 token 吞吐量:同时运行多个 agent(Codex + Claude),在等待时启动新任务,不浪费订阅额度(来源:Karpathy)
- 将自己从循环中移除:设置客观指标和边界,让 agent 自主循环运行,你只做方向性决策(来源:Karpathy)
- 编写好的 agents.md / program.md:把你的意图、规则、流程写成结构化的 Markdown,这是新的”管理层”技能(来源:Karpathy)
- 关注数字-物理接口的机会:传感器数据采集、实验自动化等数字与物理世界的桥梁领域(来源:Karpathy)
- 教育内容转向 skill 化:不再写面向人的教程,改为写面向 agent 的 skill/prompt,让 agent 做个性化教学路由(来源:Karpathy)
名言金句
“写代码这个说法甚至都不准确了。但我必须每天花16个小时向我的 agent 表达我的意图。” — Andrej Karpathy
“如果还有剩余的订阅额度,我就会紧张。那意味着我没有最大化我的 token 吞吐量。” — Andrej Karpathy
“我同时觉得自己在跟一个极其聪明的博士生说话,同时又在跟一个十岁小孩说话。” — Andrej Karpathy
“一个研究组织就是一组 Markdown 文件,描述了所有的角色以及整个系统如何连接。” — Andrej Karpathy
“我不再是在向人们解释了。我是在向 agent 解释。如果 agent 理解了,它们会来做解释。” — Andrej Karpathy
“中心化在过去的记录非常差。我希望有一个公共的开放平台,整个行业都可以使用。” — Andrej Karpathy
嘉宾原创框架
”循环移除”(Loop Removal)框架
Karpathy 提出的核心方法论:
- 识别循环中的人类瓶颈:你在哪里拖慢了系统?
- 设置客观指标:只有可验证的目标才能自动化
- 重构抽象层:设计 program.md 让 agent 自主运行
- 启动并离开:按下启动键后不再参与,最大化杠杆率
- 元优化:对 program.md 本身进行优化,寻找更好的研究组织方式
”数字-物理发展节奏差”模型
- 数字空间(比特):光速重构,存在巨大的信息处理积压待释放
- 物理空间(原子):滞后但市场更大,操纵原子比翻转比特难百万倍
- 接口层(传感器/执行器):最有趣的近期机会——给超级智能喂数据、让它操纵物理世界
资源清单
项目/工具
| 名称 | 类型 | 提及语境 |
|---|---|---|
| Auto Research | Karpathy 开源项目 | 自主 ML 实验循环,630 行 Python |
| Micro GPT | Karpathy 项目 | LLM 训练浓缩到 200 行 Python |
| Nano GPT / Micro Grad | Karpathy 历史项目 | ”精炼到本质”系列的前作 |
| OpenClaw | Peter 的项目 | 持久化 agent 架构,五大创新 |
| Dobby the Elf Claw | Karpathy 个人项目 | 智能家居管理 claw |
人物/概念
| 名称 | 类型 | 提及语境 |
|---|---|---|
| Peter Steinberg | 人物 | OpenClaw 创建者,多 Codex agent 并行的标杆用户 |
| William (Periodic CEO) | 人物 | 材料科学自主研究 |
| 杰文斯悖论 | 经济学概念 | 软件变便宜 → 需求反而增长 |
| Daemon (小说) | 书籍 | 智能操纵人类作为传感器和执行器的设想 |
| SETI at Home / Folding at Home | 分布式计算项目 | 不可信工作者池协作的先例 |
共识与分歧
共识
- AI agent 已经从根本上改变了软件工程的工作流
- 人类现在是系统中的瓶颈,而非算力
- 开源与闭源的当前格局(闭源领先、开源跟随)对行业总体是健康的
- 数字空间的变革将先于物理空间
分歧
- 无明显分歧——本期为深度访谈,主播更多是引导和追问,而非辩论
本总结由 transcript-summarizer skill 生成 方法论:金字塔原理 (Minto) + SCQA + 渐进式总结 (Forte) + In Vivo Coding 原始文件:Andrej Karpathy on Code Agents, AutoResearch, and the Loopy Era of AI_中文逐字稿.txt 本总结未使用 Shownotes 辅助信息