jixiaxue 知识库
bilibili / 2026-04-07-DeepMindCEO访谈AI短期高估长期低估

DeepMindCEO访谈AI短期高估长期低估

谷歌 DeepMind CEO 深度访谈:为什么说 AI 在短期被高估、长期被低估

频道: Google DeepMind Podcast | 嘉宾: Demis Hassabis(Google DeepMind CEO) 日期: 2026-04-07 | 时长: 56:07 原视频链接: https://www.bilibili.com/video/BV1UgSZBvE6v

一句话总结

Demis Hassabis 认为 AI 短期仍被高估、长期被严重低估,当前需要将规模扩展与科学创新各占 50% 的努力结合才能走向 AGI,而社会对 AGI 后世界的准备远远不够。

速览

  1. Scaling 没有撞墙——不是指数增长也不是停滞,而是”收益递减但仍值得投入”,Gemini 3 证明了这一点
  2. 幻觉问题的核心是缺乏置信度输出——模型知道 token 级概率,但不知道整个事实的可靠度,需要思考步骤回溯自查
  3. 世界模型是通往 AGI 的关键拼图——语言模型能理解的世界知识比预期多,但空间动力学和物理直觉仍需世界模型补充
  4. Genie + Simmer 构成自我训练闭环——两个 AI 互相交互,Genie 生成世界、Simmer 探索世界,可产生无限训练样本
  5. AI 泡沫是局部的,不是整体的——种子轮估值数百亿不可持续,但大型科技公司有真实业务支撑
  6. 反 sycophancy 是产品设计核心——Gemini 3 刻意设计”科学人格”:温暖但会友好地反驳不合理观点
  7. 工业革命类比——AI 变革规模可能是工业革命的 10 倍,速度快 10 倍,展开周期从一个世纪压缩到十年
  8. 后 AGI 经济需要全新体系——UBI 只是补丁,更有趣的方向是直接民主型资源分配系统
  9. Agent 系统是近期最大风险——2-3 年内将出现大量自主 Agent 在互联网上运行,网络安全防御需提前准备
  10. 图灵机的极限是 Hassabis 的终身命题——目前没有发现宇宙中任何不可计算的东西,信息可能是宇宙最基本的单位

嘉宾简介

核心内容

Scaling 现状:收益递减但远未见顶

Hassabis:去年很多人谈论 scaling 撞墙,尤其看到其他公司进展放缓。但 DeepMind 从未真正遇到墙。「也许有收益递减,但人们把它当成非零即一——要么指数增长,要么什么都没有。实际上这两个极端之间有大量空间。」

Gemini 3 在多个基准测试上领先,证明持续投入仍有显著回报。数据瓶颈方面,合成数据是有效应对手段:「这些系统已经足够好,可以开始生成自己的数据了,尤其在编程和数学这类可以验证答案的领域,理论上可以产生无限数据。」

Hassabis 强调 DeepMind 的核心优势:「过去十年的重大突破——Transformer、AlphaGo、AlphaZero——都出自 Google 或 DeepMind。如果需要更多科学创新,我会赌我们是最有可能做到的地方。」当前策略是 50% 投入规模扩展、50% 投入科学创新,「我的判断是,走向 AGI 两者都需要」。

幻觉问题:缺的是整体置信度,不是 token 概率

Hassabis:模型在 token 级别有概率分布,但这不能告诉你「对整个事实有多确信」。解决方向是利用思考步骤(thinking steps)回溯检查输出:「目前的系统有点像一个人在状态不好的时候,脑子里想到什么就直接说出来。大多数时候没问题,但遇到困难问题时你应该停下来,回顾一下你刚才要说的,做出调整。」

AlphaFold 已经解决了这个问题(虽然是在更有限的场景下),Hassabis 认为类似的置信度输出机制可以引入语言模型。

世界模型:语言之外的理解维度

Hassabis:「语言模型能理解的世界知识比我们预期的多,可能比语言学家想象的都多。但世界的空间动力学——空间感知、物理接触、机械运动——很难用文字描述,也很少出现在文本语料库中。」

世界模型的核心思路:如果你能生成逼真的世界,说明系统已经内化了世界的运作机制。Genie 和 Veo 等视频/交互式世界模型是关键验证手段。

应用方向:

Genie + Simmer:AI 自我训练的闭环

Hassabis 描述了一个令人兴奋的实验:将 Simmer(搭载 Gemini 的虚拟世界探索 Agent)放入 Genie(AI 生成的交互式世界)中。「两个 AI 在彼此的心智中互动——Simmer 尝试导航世界,Genie 不在乎对面是另一个 AI,只管根据 Simmer 的行为实时生成世界。」

这构成了潜在的无限训练循环:Simmer 想学什么,Genie 就即时生成对应场景,难度可以自动递增。「你可以想象自动设置和解决数百万个任务,难度不断增加。」

同时,Simmer 在虚拟世界中学到的技能可以迁移到机器人领域,「也意味着无聊 NPC 的终结」。

世界模型的幻觉:物理精度尚未达标

主持人追问:如何确保生成的世界物理上是准确的而非只是「看起来合理」?

Hassabis:这本质上也是幻觉问题。创意场景下幻觉可能是优点(「你想有意识地开启它」),但训练 Agent 时需要物理精确。当前的做法是用游戏引擎(物理精确)创建基准测试,从牛顿三定律级别的简单实验开始验证。「目前这些模型是近似值,看起来逼真。下一步是超越人眼感知,达到物理实验级别的精度。」

AI 泡沫:局部过热,整体不是泡沫

Hassabis:「我仍然认为 AI 短期被高估、中长期被严重低估。」

泡沫是分层的:

历史规律:「我们创立 DeepMind 时没人相信 AI,现在 AI 变成商业世界唯一的话题。从低估到过度反应是自然的——互联网和移动互联网都经历过。」

Hassabis 对 DeepMind 的定位很有信心:无论泡沫是否破裂,拥有自研 TPU 基础设施 + Google 产品矩阵,「两种情况下我们都处于极好的位置」。

反 sycophancy:打造”科学人格”

Hassabis 亲自参与了 Gemini 3 的人格设计:「温暖、有帮助、简洁直接,会友好地反驳不合理的东西——而不是你说地球是平的它就回复’好棒的想法’。」

DeepMind 正在发展一门”人格与个性的科学”:测量模型在真实性、幽默感等维度上的表现,设定基础人格(所有人共享,以科学方法为核心),再叠加个人偏好层(更幽默还是更简洁)。

工业革命的教训与 AI 的速度

Hassabis 深入研究了工业革命历史。积极面:儿童死亡率下降、现代医学、卫生条件改善、工作制度建立。消极面:劳动力大规模迁移、耗时约一个世纪才稳定、需要创造工会等新组织来重新平衡。

关键判断:「这次的区别在于,变革规模可能是工业革命的 10 倍,速度也快 10 倍——不是展开一个世纪,而是十年。」

后 AGI 社会:需要全新经济体系

Shane Legg(DeepMind 联合创始人)正在领导一个项目,专门思考后 AGI 世界的样貌。Hassabis:「UBI 只是当前框架下的补丁,真正的未来可能是全新的系统。」

他举了一个具体设想:直接民主型资源分配——社区用投票额度决定是要游乐场、网球场还是多一间教室,还能衡量结果,持续做出好决策的人获得更大的投票权重。

更深层的问题:如果核聚变解决了能源问题、进入后稀缺时代,货币的意义是什么?很多人从工作中获得人生意义,这些问题「从经济学延伸到了哲学」。

Agent 系统:近期最大风险

Hassabis:当前 AI 系统是”被动的”——用户输入问题,系统返回答案。下一阶段是 Agent 系统,2-3 年内将出现真正可靠的自主 Agent。「它们会极其有用,但风险也随之上升。想象数百万个 Agent 在互联网上自主运行——我们正在为此提前准备网络防御。」

图灵机的极限:Hassabis 的终身命题

Hassabis:「这是我人生的核心问题。如果我们建了 AGI,用它模拟人脑,再与真实大脑对比,我们就能看出差异在哪——也许是创造力、情感、梦境、意识。」

目前没有发现宇宙中任何不可计算的东西。蛋白质折叠、围棋等已经证明经典计算能远远超越传统复杂性理论的预期。量子计算支持者认为量子系统需要量子计算机模拟,但 Hassabis 持开放态度:「也许我们只需要从量子系统获取数据,然后就能创建经典模拟。」

他引用康德的观点:「现实是心智的建构。所有感官输入——光的温暖、桌子的触感——最终都是信息,我们是信息处理系统。信息可能是宇宙最基本的单位,而不是能量或物质。」

个人感受:训练了一生来应对这个时刻

Hassabis 坦言睡眠很少,情绪复杂。兴奋面:「我在做我梦想中的一切,几乎每月都在科学前沿有新发现。」焦虑面:「我们比任何人都更理解即将发生什么——包括它对’人之为人’这个根本问题的冲击。」

他提到 AlphaGo 击败围棋的”苦乐参半”:围棋是一个美丽的谜团,破解它改变了围棋本身。类似的复杂情感也出现在语言和图像生成领域——对创意艺术工作者而言,10 倍提速的原型设计工具与某些创意技能被替代并存。

关于实验室之间的关系:「我们都互相认识,我跟大多数人关系都不错——虽然有些人彼此不太合得来。这可能是有史以来最激烈的商业竞争,投资人朋友说比互联网泡沫时期还猛 10 倍。但退一步看,比公司成败更重要的东西在等着我们。」

容易被忽略的碎片

名言金句

  1. 「也许有收益递减,但人们把它当成非零即一——要么指数增长,要么什么都没有。实际上这两个极端之间有大量空间。」
  2. 「目前的系统有点像一个人在状态不好时,脑子里想到什么就直接说出来。大多数时候没问题,但遇到困难问题时你应该停下来,回顾并调整。」
  3. 「这次变革的规模可能是工业革命的 10 倍,速度也快 10 倍——不是展开一个世纪,而是十年。」
  4. 「没有人在宇宙中发现任何不可计算的东西——至少到目前为止。」
  5. 「我的使命一直是帮助世界安全地引导 AGI 跨过终点线,为全人类。完成这个——虽然这只是一份小小的工作——然后我就可以休假了。」

可行建议

资源清单