谷歌 DeepMind CEO 深度访谈:为什么说 AI 在短期被高估、长期被低估
频道: Google DeepMind Podcast | 嘉宾: Demis Hassabis(Google DeepMind CEO) 日期: 2026-04-07 | 时长: 56:07 原视频链接: https://www.bilibili.com/video/BV1UgSZBvE6v
一句话总结
Demis Hassabis 认为 AI 短期仍被高估、长期被严重低估,当前需要将规模扩展与科学创新各占 50% 的努力结合才能走向 AGI,而社会对 AGI 后世界的准备远远不够。
速览
- Scaling 没有撞墙——不是指数增长也不是停滞,而是”收益递减但仍值得投入”,Gemini 3 证明了这一点
- 幻觉问题的核心是缺乏置信度输出——模型知道 token 级概率,但不知道整个事实的可靠度,需要思考步骤回溯自查
- 世界模型是通往 AGI 的关键拼图——语言模型能理解的世界知识比预期多,但空间动力学和物理直觉仍需世界模型补充
- Genie + Simmer 构成自我训练闭环——两个 AI 互相交互,Genie 生成世界、Simmer 探索世界,可产生无限训练样本
- AI 泡沫是局部的,不是整体的——种子轮估值数百亿不可持续,但大型科技公司有真实业务支撑
- 反 sycophancy 是产品设计核心——Gemini 3 刻意设计”科学人格”:温暖但会友好地反驳不合理观点
- 工业革命类比——AI 变革规模可能是工业革命的 10 倍,速度快 10 倍,展开周期从一个世纪压缩到十年
- 后 AGI 经济需要全新体系——UBI 只是补丁,更有趣的方向是直接民主型资源分配系统
- Agent 系统是近期最大风险——2-3 年内将出现大量自主 Agent 在互联网上运行,网络安全防御需提前准备
- 图灵机的极限是 Hassabis 的终身命题——目前没有发现宇宙中任何不可计算的东西,信息可能是宇宙最基本的单位
嘉宾简介
- Demis Hassabis:Google DeepMind CEO 兼联合创始人,国际象棋神童出身,曾创立 DeepMind(后被 Google 收购),主导了 AlphaGo、AlphaFold 等里程碑项目。本期回顾过去一年 AI 进展,展望 AGI 路径和社会影响。
核心内容
Scaling 现状:收益递减但远未见顶
Hassabis:去年很多人谈论 scaling 撞墙,尤其看到其他公司进展放缓。但 DeepMind 从未真正遇到墙。「也许有收益递减,但人们把它当成非零即一——要么指数增长,要么什么都没有。实际上这两个极端之间有大量空间。」
Gemini 3 在多个基准测试上领先,证明持续投入仍有显著回报。数据瓶颈方面,合成数据是有效应对手段:「这些系统已经足够好,可以开始生成自己的数据了,尤其在编程和数学这类可以验证答案的领域,理论上可以产生无限数据。」
Hassabis 强调 DeepMind 的核心优势:「过去十年的重大突破——Transformer、AlphaGo、AlphaZero——都出自 Google 或 DeepMind。如果需要更多科学创新,我会赌我们是最有可能做到的地方。」当前策略是 50% 投入规模扩展、50% 投入科学创新,「我的判断是,走向 AGI 两者都需要」。
幻觉问题:缺的是整体置信度,不是 token 概率
Hassabis:模型在 token 级别有概率分布,但这不能告诉你「对整个事实有多确信」。解决方向是利用思考步骤(thinking steps)回溯检查输出:「目前的系统有点像一个人在状态不好的时候,脑子里想到什么就直接说出来。大多数时候没问题,但遇到困难问题时你应该停下来,回顾一下你刚才要说的,做出调整。」
AlphaFold 已经解决了这个问题(虽然是在更有限的场景下),Hassabis 认为类似的置信度输出机制可以引入语言模型。
世界模型:语言之外的理解维度
Hassabis:「语言模型能理解的世界知识比我们预期的多,可能比语言学家想象的都多。但世界的空间动力学——空间感知、物理接触、机械运动——很难用文字描述,也很少出现在文本语料库中。」
世界模型的核心思路:如果你能生成逼真的世界,说明系统已经内化了世界的运作机制。Genie 和 Veo 等视频/交互式世界模型是关键验证手段。
应用方向:
- 机器人:需要世界理解才能在日常生活中工作
- 通用助手:未来可能通过眼镜或手机陪伴用户日常生活
- 科学模拟:天气、材料、生物学等领域的高效模拟
- 游戏:「这可能一直是我潜意识里的终极计划」
Genie + Simmer:AI 自我训练的闭环
Hassabis 描述了一个令人兴奋的实验:将 Simmer(搭载 Gemini 的虚拟世界探索 Agent)放入 Genie(AI 生成的交互式世界)中。「两个 AI 在彼此的心智中互动——Simmer 尝试导航世界,Genie 不在乎对面是另一个 AI,只管根据 Simmer 的行为实时生成世界。」
这构成了潜在的无限训练循环:Simmer 想学什么,Genie 就即时生成对应场景,难度可以自动递增。「你可以想象自动设置和解决数百万个任务,难度不断增加。」
同时,Simmer 在虚拟世界中学到的技能可以迁移到机器人领域,「也意味着无聊 NPC 的终结」。
世界模型的幻觉:物理精度尚未达标
主持人追问:如何确保生成的世界物理上是准确的而非只是「看起来合理」?
Hassabis:这本质上也是幻觉问题。创意场景下幻觉可能是优点(「你想有意识地开启它」),但训练 Agent 时需要物理精确。当前的做法是用游戏引擎(物理精确)创建基准测试,从牛顿三定律级别的简单实验开始验证。「目前这些模型是近似值,看起来逼真。下一步是超越人眼感知,达到物理实验级别的精度。」
AI 泡沫:局部过热,整体不是泡沫
Hassabis:「我仍然认为 AI 短期被高估、中长期被严重低估。」
泡沫是分层的:
- 过热区域:种子轮创业公司还没起步就拿到数百亿美元估值,「我猜大概率不可持续」
- 有支撑的区域:大型科技公司有真实业务——搜索、YouTube、Chrome、Workspace 等都在被 AI 改造
历史规律:「我们创立 DeepMind 时没人相信 AI,现在 AI 变成商业世界唯一的话题。从低估到过度反应是自然的——互联网和移动互联网都经历过。」
Hassabis 对 DeepMind 的定位很有信心:无论泡沫是否破裂,拥有自研 TPU 基础设施 + Google 产品矩阵,「两种情况下我们都处于极好的位置」。
反 sycophancy:打造”科学人格”
Hassabis 亲自参与了 Gemini 3 的人格设计:「温暖、有帮助、简洁直接,会友好地反驳不合理的东西——而不是你说地球是平的它就回复’好棒的想法’。」
DeepMind 正在发展一门”人格与个性的科学”:测量模型在真实性、幽默感等维度上的表现,设定基础人格(所有人共享,以科学方法为核心),再叠加个人偏好层(更幽默还是更简洁)。
工业革命的教训与 AI 的速度
Hassabis 深入研究了工业革命历史。积极面:儿童死亡率下降、现代医学、卫生条件改善、工作制度建立。消极面:劳动力大规模迁移、耗时约一个世纪才稳定、需要创造工会等新组织来重新平衡。
关键判断:「这次的区别在于,变革规模可能是工业革命的 10 倍,速度也快 10 倍——不是展开一个世纪,而是十年。」
后 AGI 社会:需要全新经济体系
Shane Legg(DeepMind 联合创始人)正在领导一个项目,专门思考后 AGI 世界的样貌。Hassabis:「UBI 只是当前框架下的补丁,真正的未来可能是全新的系统。」
他举了一个具体设想:直接民主型资源分配——社区用投票额度决定是要游乐场、网球场还是多一间教室,还能衡量结果,持续做出好决策的人获得更大的投票权重。
更深层的问题:如果核聚变解决了能源问题、进入后稀缺时代,货币的意义是什么?很多人从工作中获得人生意义,这些问题「从经济学延伸到了哲学」。
Agent 系统:近期最大风险
Hassabis:当前 AI 系统是”被动的”——用户输入问题,系统返回答案。下一阶段是 Agent 系统,2-3 年内将出现真正可靠的自主 Agent。「它们会极其有用,但风险也随之上升。想象数百万个 Agent 在互联网上自主运行——我们正在为此提前准备网络防御。」
图灵机的极限:Hassabis 的终身命题
Hassabis:「这是我人生的核心问题。如果我们建了 AGI,用它模拟人脑,再与真实大脑对比,我们就能看出差异在哪——也许是创造力、情感、梦境、意识。」
目前没有发现宇宙中任何不可计算的东西。蛋白质折叠、围棋等已经证明经典计算能远远超越传统复杂性理论的预期。量子计算支持者认为量子系统需要量子计算机模拟,但 Hassabis 持开放态度:「也许我们只需要从量子系统获取数据,然后就能创建经典模拟。」
他引用康德的观点:「现实是心智的建构。所有感官输入——光的温暖、桌子的触感——最终都是信息,我们是信息处理系统。信息可能是宇宙最基本的单位,而不是能量或物质。」
个人感受:训练了一生来应对这个时刻
Hassabis 坦言睡眠很少,情绪复杂。兴奋面:「我在做我梦想中的一切,几乎每月都在科学前沿有新发现。」焦虑面:「我们比任何人都更理解即将发生什么——包括它对’人之为人’这个根本问题的冲击。」
他提到 AlphaGo 击败围棋的”苦乐参半”:围棋是一个美丽的谜团,破解它改变了围棋本身。类似的复杂情感也出现在语言和图像生成领域——对创意艺术工作者而言,10 倍提速的原型设计工具与某些创意技能被替代并存。
关于实验室之间的关系:「我们都互相认识,我跟大多数人关系都不错——虽然有些人彼此不太合得来。这可能是有史以来最激烈的商业竞争,投资人朋友说比互联网泡沫时期还猛 10 倍。但退一步看,比公司成败更重要的东西在等着我们。」
容易被忽略的碎片
- DeepMind 与核聚变项目建立了深度合作(新 partnership),用机器学习帮助解决聚变问题,Hassabis 认为聚变一旦实现将解锁大规模海水淡化、火箭燃料生产等连锁效应
- AlphaFold 已迎来五周年,Hassabis 提到材料科学(室温超导、更好的电池)是 AI for Science 的下一个重点方向
- Hassabis 提到 Gemini Nano/Banana Pro 系统(图像生成工具)搭载了 Gemini,能理解图像的语义内容——比如给一张复杂飞机的照片,能标注所有零件并做爆炸图,他称之为”图像领域的 AGI”
- 他在业余时间研究物理学理论,探索”信息是宇宙最基本单位”的假说
- 提到 Santa Fe 研究所早期的网格世界实验:让 Agent 在简单环境中长时间运行,自发发明了市场、银行等制度
名言金句
- 「也许有收益递减,但人们把它当成非零即一——要么指数增长,要么什么都没有。实际上这两个极端之间有大量空间。」
- 「目前的系统有点像一个人在状态不好时,脑子里想到什么就直接说出来。大多数时候没问题,但遇到困难问题时你应该停下来,回顾并调整。」
- 「这次变革的规模可能是工业革命的 10 倍,速度也快 10 倍——不是展开一个世纪,而是十年。」
- 「没有人在宇宙中发现任何不可计算的东西——至少到目前为止。」
- 「我的使命一直是帮助世界安全地引导 AGI 跨过终点线,为全人类。完成这个——虽然这只是一份小小的工作——然后我就可以休假了。」
可行建议
- 关注 Genie + Simmer 的自训练范式:两个 AI 互相交互产生无限训练数据,这可能成为突破数据瓶颈的重要路径
- AI 产品设计应优先解决 sycophancy 问题:DeepMind 的”科学人格 + 个性化层”框架值得参考
- 开始思考后 AGI 经济模型:UBI 只是起点,直接民主型资源分配等新范式值得关注
- 企业应提前布局 Agent 安全:2-3 年内大量自主 Agent 将上线,网络安全防御需要先行
资源清单
- Gemini 3:Google DeepMind 最新大模型
- AlphaFold:蛋白质结构预测工具,已发布五周年
- Genie:Google DeepMind 的交互式世界模型
- Simmer:Google DeepMind 的模拟 Agent 系统(搭载 Gemini)
- Veo:Google DeepMind 的视频生成模型
- Gemini Nano/Banana Pro:具有语义理解能力的图像生成系统
- Isomorphic Labs:Hassabis 创立的 AI 药物发现公司