通过真实使用数据理解劳动力市场
来源: OpenAI Forum | 对话者: Ronnie Chatterji(OpenAI 首席经济学家)× Alex Martin Richmond(OpenAI 劳动经济学家)× Daniel Rock(Wharton 助理教授)× Gregor Schubert(UCLA 助理教授)| 日期: 2026-04-15 原文链接: https://forum.openai.com/public/videos/event-replay-understanding-the-labor-market-through-real-world-usage-data-2026-04-15
一句话总结
四位经济学家基于 OpenAI 真实使用数据讨论了”AI 无处不在但宏观数据看不出来”的悖论——核心解释是”生产力 J 曲线”效应:组织正在大量投入不可见的组织资本,AI 做的是”中间到中间”而非”端到端”的工作,而围绕 AI 涌现的新任务(结构化输入 + 验证输出)正在重塑而非消灭岗位。
速览
- Solow 悖论重现——9 亿+周活用户,但宏观生产力数据无明显变化;这不是”搞错了”,而是”生产力 J 曲线”——前期投入组织资本看起来像拖累。
- AI 做”中间到中间”,不做”端到端”——AI 处理中间执行层,两端新增”结构化输入”和”验证输出”的人类任务,岗位在重组而非消失。
- “能力过剩”(Capability Overhang)——大量用户在用 AI,但大多数尚未触及前沿能力,生产力还有巨大未释放空间。
- 自动化 vs 增强难以区分——把任务交给 Codex 后产生新的验证任务,到底算自动化还是增强?衡量方式本身是研究前沿。
- 家庭使用是隐藏的冰山——更多人在家里而非工作中使用 AI,产生大量消费者剩余(旅行规划、健康研究等),但不计入 GDP。
- 30% 的消费端 ChatGPT 使用是工作相关的——个人使用和工作使用的边界模糊,家里的实验免费训练了工作能力。
- 企业采纳速度取决于已有技术能力——已有技术基础的公司更快、更好地将 AI 潜力转化为实际收益。
- 从 IT 部门主导到领域专家主导——韩国银行 CEO 案例:转向雇佣有领域专业知识的人并赋能 AI 工具,而非从 IT 部门自上而下推行。
- 政策优先级——利用现有失业保险基础设施(可能延长期限)、公共投资 AI 培训(10-20 周)、确保所有人接触前沿模型、小规模政策实验。
- 学科不会贬值,贬值的是学科内的执行性任务——历史学的档案工作变成结构化自动审查,经济学解题能力变得不那么重要,但提出好问题和找到有趣数据集变得更重要。
核心内容
一、Solow 悖论 2.0 与生产力 J 曲线
Chatterji 开场抛出核心问题:一方面,OpenAI 有超过 9 亿周活用户、企业使用量显著增长、模型能力快速进步;另一方面,劳动力市场数据几乎看不出变化。“经济学家有两只手——一边看到 AI 无处不在,另一边看到数据没动。我们搞错了什么?”
Rock 回应:这不是搞错了。1987 年 Bob Solow 说”到处都能看到计算机,但生产力统计里看不到”,现在是同一个版本。他与 Erik Brynjolfsson 和 Chad Syverson 合写的”生产力 J 曲线”论文解释了这个现象——组织在前期需要大量投资于不可见的组织资本(文化、流程、工厂重配),这些投资在外部看起来像生产力拖累,但一旦基础建好,就会爆发式增长。
Schubert 补充了两个过滤层:
- **从”AI 暴露”到”实际使用”**的转化率参差不齐——有预存技术能力的企业转化更快。
- 组织重组本身需要时间——他在教授 AI 组织变革课程时,学生反馈”对齐和角色重新定义”花费大量时间。产品经理的角色已经变得横跨营销和开发。在 playbook 清晰之前,新角色不断涌现、试错、调整。
二、“中间到中间”:AI 如何重组而非消灭任务
Schubert 提出一个关键框架:“中间到中间”(middle to middle)而非”端到端”(end to end)——AI 处理任务链的中间执行层,但两端新增了人类工作:
- 前端:结构化输入——规划如何拆解任务、准备数据、设计 AI 工作流
- 后端:验证输出——评估 AI 产出质量、确保正确性
他以一家韩国银行为例:CEO 正在把资源从 IT 部门驱动的技术实施转向雇佣领域专家并赋予他们 AI 工具能力。原因是设计好的验证和输入结构需要领域专业知识,不能让纯技术后端的人来设计面向客户或内部的 AI 工作流。
Richmond 用自己的亲身经历印证:把任务交给 Codex 后,新增了”在告诉 Ronnie 结果正确之前验证 Codex 做得对不对”的任务。这到底算自动化还是增强?她的团队正在研究如何测量——“比看起来难得多:即使看似完全自动化的任务,往往也没有展示完整的自动化图景。“
三、蒸汽机到电动机的组织类比
Rock 做了一个更宏观的类比:蒸汽机时代,工厂有一台巨大的蒸汽引擎通过皮带和滑轮给所有机器供电——集中式动力。电动机最初只是用来替代蒸汽引擎做同样的事,改善有限。过了数十年,人们才想明白可以模块化电力——每台机器自带小电机,彻底重构生产流程。
当前大多数公司有集中式 IT 部门(hub-and-spoke 模型),服务于构建技术的人。但如果人人都能用 AI 为自己的目的构建工具,IT 功能应该被模块化——分布到销售、营销、采购各部门。IT 部门不知道销售最佳实践,但知道如何构建安全、可维护、可靠的软件。他观察到一些组织把工程师部署到组织其余部分,这种做法带来更快的生产力提升。
四、消费者使用的隐藏冰山
Schubert 与合作者的研究发现:当前更多人在家庭环境中使用 AI,而非工作中。这些使用——旅行规划、健康问题研究、晚餐派对策划、购物清单——创造了大量经济价值,但完全不计入 GDP,因为它是消费者剩余。用户为前沿模型付费极少,却获得大量使用价值。
Richmond 提供了一个数据点:约 30% 的消费端 ChatGPT 使用是与工作相关的——人们在个人和工作使用之间的边界模糊。Rock 补充:公司因此获得了大量免费培训——员工在家里的使用等于自主提升了工作能力。
这意味着传统的宏观经济统计(GDP、生产力指标)系统性地低估了 AI 的实际影响。Richmond 希望美国能有更好的行政数据(与税收或工资数据挂钩的职业级别变化测量),但目前主要依赖较小的调查推断。
五、“能力过剩”:大多数用户远未触及前沿
Richmond 提出”能力过剩”(Capability Overhang)概念:大量用户在使用 AI 工具,但大多数人仍在摸索前沿用法、未能完全在工作流中利用 AI 能力。AI 几个月前还做不好的事现在已经做得很好,但用户的认知和实践还没跟上。
Schubert 从培训角度验证这一点:他教 MBA 课程的 AI 模块需要五周时间,让知识水平已经较高的研究生感觉能自信使用工具。而大多数劳动力缺乏这种准备。他估计所有人需要 10-20 周的 AI 培训才能完全流利——这需要作为公共产品进行公共投资,而不仅仅是企业内训。
最大的差距在于:没用过前沿模型的人对 AI 能力有扭曲的认知,难以设想 AI 的生产性用途。
六、企业文化的两面:探索者与匠人
Rock 从企业实施角度描述了两种人群的张力:
- 探索者:发现新的激动人心的用例,把发现传播给同事并整合到工作流中——他们是最好的员工。组织需要鼓励实验和容忍失败的文化来培养这些人。
- 匠人:追求高质量工作,有时会因为 AI 的错误而放弃使用——他们需要防护栏和责任机制来引导,可以被拉入成为”以正确方式使用技术的布道者”。
两类人都有价值,关键是建立让两者都能发挥作用的制度环境。
七、政策建议
三位学者各自提出了政策优先级:
Richmond(OpenAI):
- 美国失业保险制度设计得相当好,适合应对短期就业冲击
- 但 AI 可能导致”更大技能距离”的转型(与以往不同行业间的类似岗位转移不同),可能需要更慷慨或更长期限的失业保险
- 不要低估现有制度(累进税制、失业保险)的能力——加上适当的资金和微调,它们能做不少工作
Schubert(UCLA):
- 投资 AI 赋能培训:10-20 周的 AI 训练作为公共产品
- 确保所有人接触前沿模型——没用过的人有扭曲的能力认知
- 培训不应只是企业行为(那只惠及在职员工)
Rock(Wharton):
- 作为前期权交易员的思维方式:面对不确定性,建立”政策期权”组合——小规模实验,看到效果就快速扩大
- 帮助人们”冲入” AI 密集型工作并受益,而不是害怕 AI
- 专业知识意味着”你知道问题在哪”——创建灵活项目让人们快速发展专业知识,自己构建解决方案
八、学什么专业:学科不贬值,执行性任务贬值
Rock:AI、经济学、工程和科学仍然是好选择——但更重要的是问题解决能力。同时需要人文学科的人解释这些变化对世界意味着什么。不要对抗技术,而是融入它。
Schubert 提出更精确的框架:不是整个学科贬值,是学科内的执行性任务贬值。
- 历史学:档案工作变成结构化自动文档审查和工具构建
- 经济学:解题和代数能力变得不那么重要,但找有趣数据集和提出有趣问题变得更重要
- 所有领域:更多精力放在提出好问题、发现大问题、发展判断力和主动性,而非执行性任务
九、让工作更有意义:AI 接管无聊部分
Richmond 举了一个具体案例:OpenAI 团队访问国家美术馆,观察策展人和修复师如何工作——他们花大量时间记录修复过程(档案工作),挤占了实际修复和保存艺术品的时间。AI 可以自动化记录部分,让他们回到真正热爱的工作。
Schubert 回忆战略咨询的经历:卖给年轻毕业生的是”花时间解决大战略问题”,实际工作是做 PPT、做会议记录、做总结。而这些无聊部分恰恰是 AI 擅长的——总结文本、做会议记录、做 PPT。他的研究发现:人们把个人生活中的”杂务”用 AI 加速完成后,会把节省的时间花在真正享受的事情上。
名言金句
- “到处都能看到计算机,但生产力统计里看不到。“——Rock 引用 Bob Solow 1987 年名言,指出当前正在重演
- “AI 做的是’中间到中间’,不是’端到端’。“——Schubert 描述 AI 在任务链中的实际角色
- “能力过剩——大量用户在用工具,但还没摸到前沿。“——Richmond 定义当前 AI 采纳的核心瓶颈
- “你知道问题在哪,只有你有专业知识。“——Rock 论为什么应该让人”冲入” AI 而非远离
- “想象一下我们不再整天认知过载。“——Schubert 描述 AI 释放认知空间的愿景
可行建议
- 个人:用 AI 处理最无聊的重复性工作(填表、写邮件、做记录),把时间还给最有趣的认知密集型任务
- 企业:把 AI 实施从 IT 部门主导转向领域专家赋能模式——让了解业务的人设计 AI 工作流,IT 提供安全和可靠性支持
- 企业文化:同时培养”探索者”(奖励发现新用例的人)和”匠人”(用防护栏引导追求品质的人)
- 教育:不要放弃任何学科,但重新分配精力——减少执行性任务训练,增加提问能力、数据发现、判断力和主动性
- 政策制定者:区分”被 AI 影响”和”被 AI 增强”的岗位,对前者提供定向支持;投资 10-20 周的公共 AI 培训项目;确保前沿模型的普遍可及
资源清单
- “The Productivity J-Curve”(Daniel Rock, Erik Brynjolfsson, Chad Syverson 合著论文)——解释为什么 AI 投资短期看像生产力拖累
- GPT 劳动力市场暴露论文(Daniel Rock, Pamela Mishkin, Taina Eloundou, Sam Manning)——AI 对职业任务的暴露度研究
- OpenAI Signals(OpenAI 发布的使用数据网站)——真实 AI 使用模式数据
- OpenAI AGI 产业政策报告——数周前发布的政策建议文档
- Workhelix(Daniel Rock 联合创办)——帮助企业识别和实施 AI 用例
- Gregor Schubert 与 Michael Blank, Ben Zhang 的消费者 AI 使用研究——家庭 AI 使用的消费者剩余