谷歌 DeepMind CEO 深度访谈：为什么说 AI 在短期被高估、长期被低估

频道: Google DeepMind Podcast | 嘉宾: Demis Hassabis（Google DeepMind CEO）日期: 2026-04-07 | 时长: 56:07 原视频链接: https://www.bilibili.com/video/BV1UgSZBvE6v

一句话总结

Demis Hassabis 认为 AI 短期仍被高估、长期被严重低估，当前需要将规模扩展与科学创新各占 50% 的努力结合才能走向 AGI，而社会对 AGI 后世界的准备远远不够。

速览

Scaling 没有撞墙——不是指数增长也不是停滞，而是”收益递减但仍值得投入”，Gemini 3 证明了这一点
幻觉问题的核心是缺乏置信度输出——模型知道 token 级概率，但不知道整个事实的可靠度，需要思考步骤回溯自查
世界模型是通往 AGI 的关键拼图——语言模型能理解的世界知识比预期多，但空间动力学和物理直觉仍需世界模型补充
Genie + Simmer 构成自我训练闭环——两个 AI 互相交互，Genie 生成世界、Simmer 探索世界，可产生无限训练样本
AI 泡沫是局部的，不是整体的——种子轮估值数百亿不可持续，但大型科技公司有真实业务支撑
反 sycophancy 是产品设计核心——Gemini 3 刻意设计”科学人格”：温暖但会友好地反驳不合理观点
工业革命类比——AI 变革规模可能是工业革命的 10 倍，速度快 10 倍，展开周期从一个世纪压缩到十年
后 AGI 经济需要全新体系——UBI 只是补丁，更有趣的方向是直接民主型资源分配系统
Agent 系统是近期最大风险——2-3 年内将出现大量自主 Agent 在互联网上运行，网络安全防御需提前准备
图灵机的极限是 Hassabis 的终身命题——目前没有发现宇宙中任何不可计算的东西，信息可能是宇宙最基本的单位

嘉宾简介

Demis Hassabis：Google DeepMind CEO 兼联合创始人，国际象棋神童出身，曾创立 DeepMind（后被 Google 收购），主导了 AlphaGo、AlphaFold 等里程碑项目。本期回顾过去一年 AI 进展，展望 AGI 路径和社会影响。

核心内容

Scaling 现状：收益递减但远未见顶

Hassabis：去年很多人谈论 scaling 撞墙，尤其看到其他公司进展放缓。但 DeepMind 从未真正遇到墙。「也许有收益递减，但人们把它当成非零即一——要么指数增长，要么什么都没有。实际上这两个极端之间有大量空间。」

Gemini 3 在多个基准测试上领先，证明持续投入仍有显著回报。数据瓶颈方面，合成数据是有效应对手段：「这些系统已经足够好，可以开始生成自己的数据了，尤其在编程和数学这类可以验证答案的领域，理论上可以产生无限数据。」

Hassabis 强调 DeepMind 的核心优势：「过去十年的重大突破——Transformer、AlphaGo、AlphaZero——都出自 Google 或 DeepMind。如果需要更多科学创新，我会赌我们是最有可能做到的地方。」当前策略是 50% 投入规模扩展、50% 投入科学创新，「我的判断是，走向 AGI 两者都需要」。

幻觉问题：缺的是整体置信度，不是 token 概率

Hassabis：模型在 token 级别有概率分布，但这不能告诉你「对整个事实有多确信」。解决方向是利用思考步骤（thinking steps）回溯检查输出：「目前的系统有点像一个人在状态不好的时候，脑子里想到什么就直接说出来。大多数时候没问题，但遇到困难问题时你应该停下来，回顾一下你刚才要说的，做出调整。」

AlphaFold 已经解决了这个问题（虽然是在更有限的场景下），Hassabis 认为类似的置信度输出机制可以引入语言模型。

世界模型：语言之外的理解维度

Hassabis：「语言模型能理解的世界知识比我们预期的多，可能比语言学家想象的都多。但世界的空间动力学——空间感知、物理接触、机械运动——很难用文字描述，也很少出现在文本语料库中。」

世界模型的核心思路：如果你能生成逼真的世界，说明系统已经内化了世界的运作机制。Genie 和 Veo 等视频/交互式世界模型是关键验证手段。

应用方向：

机器人：需要世界理解才能在日常生活中工作
通用助手：未来可能通过眼镜或手机陪伴用户日常生活
科学模拟：天气、材料、生物学等领域的高效模拟
游戏：「这可能一直是我潜意识里的终极计划」

Genie + Simmer：AI 自我训练的闭环

Hassabis 描述了一个令人兴奋的实验：将 Simmer（搭载 Gemini 的虚拟世界探索 Agent）放入 Genie（AI 生成的交互式世界）中。「两个 AI 在彼此的心智中互动——Simmer 尝试导航世界，Genie 不在乎对面是另一个 AI，只管根据 Simmer 的行为实时生成世界。」

这构成了潜在的无限训练循环：Simmer 想学什么，Genie 就即时生成对应场景，难度可以自动递增。「你可以想象自动设置和解决数百万个任务，难度不断增加。」

同时，Simmer 在虚拟世界中学到的技能可以迁移到机器人领域，「也意味着无聊 NPC 的终结」。

世界模型的幻觉：物理精度尚未达标

主持人追问：如何确保生成的世界物理上是准确的而非只是「看起来合理」？

Hassabis：这本质上也是幻觉问题。创意场景下幻觉可能是优点（「你想有意识地开启它」），但训练 Agent 时需要物理精确。当前的做法是用游戏引擎（物理精确）创建基准测试，从牛顿三定律级别的简单实验开始验证。「目前这些模型是近似值，看起来逼真。下一步是超越人眼感知，达到物理实验级别的精度。」

AI 泡沫：局部过热，整体不是泡沫

Hassabis：「我仍然认为 AI 短期被高估、中长期被严重低估。」

泡沫是分层的：

过热区域：种子轮创业公司还没起步就拿到数百亿美元估值，「我猜大概率不可持续」
有支撑的区域：大型科技公司有真实业务——搜索、YouTube、Chrome、Workspace 等都在被 AI 改造

历史规律：「我们创立 DeepMind 时没人相信 AI，现在 AI 变成商业世界唯一的话题。从低估到过度反应是自然的——互联网和移动互联网都经历过。」

Hassabis 对 DeepMind 的定位很有信心：无论泡沫是否破裂，拥有自研 TPU 基础设施 + Google 产品矩阵，「两种情况下我们都处于极好的位置」。

反 sycophancy：打造”科学人格”

Hassabis 亲自参与了 Gemini 3 的人格设计：「温暖、有帮助、简洁直接，会友好地反驳不合理的东西——而不是你说地球是平的它就回复’好棒的想法’。」

DeepMind 正在发展一门”人格与个性的科学”：测量模型在真实性、幽默感等维度上的表现，设定基础人格（所有人共享，以科学方法为核心），再叠加个人偏好层（更幽默还是更简洁）。

工业革命的教训与 AI 的速度

Hassabis 深入研究了工业革命历史。积极面：儿童死亡率下降、现代医学、卫生条件改善、工作制度建立。消极面：劳动力大规模迁移、耗时约一个世纪才稳定、需要创造工会等新组织来重新平衡。

关键判断：「这次的区别在于，变革规模可能是工业革命的 10 倍，速度也快 10 倍——不是展开一个世纪，而是十年。」

后 AGI 社会：需要全新经济体系

Shane Legg（DeepMind 联合创始人）正在领导一个项目，专门思考后 AGI 世界的样貌。Hassabis：「UBI 只是当前框架下的补丁，真正的未来可能是全新的系统。」

他举了一个具体设想：直接民主型资源分配——社区用投票额度决定是要游乐场、网球场还是多一间教室，还能衡量结果，持续做出好决策的人获得更大的投票权重。

更深层的问题：如果核聚变解决了能源问题、进入后稀缺时代，货币的意义是什么？很多人从工作中获得人生意义，这些问题「从经济学延伸到了哲学」。

Agent 系统：近期最大风险

Hassabis：当前 AI 系统是”被动的”——用户输入问题，系统返回答案。下一阶段是 Agent 系统，2-3 年内将出现真正可靠的自主 Agent。「它们会极其有用，但风险也随之上升。想象数百万个 Agent 在互联网上自主运行——我们正在为此提前准备网络防御。」

图灵机的极限：Hassabis 的终身命题

Hassabis：「这是我人生的核心问题。如果我们建了 AGI，用它模拟人脑，再与真实大脑对比，我们就能看出差异在哪——也许是创造力、情感、梦境、意识。」

目前没有发现宇宙中任何不可计算的东西。蛋白质折叠、围棋等已经证明经典计算能远远超越传统复杂性理论的预期。量子计算支持者认为量子系统需要量子计算机模拟，但 Hassabis 持开放态度：「也许我们只需要从量子系统获取数据，然后就能创建经典模拟。」

他引用康德的观点：「现实是心智的建构。所有感官输入——光的温暖、桌子的触感——最终都是信息，我们是信息处理系统。信息可能是宇宙最基本的单位，而不是能量或物质。」

个人感受：训练了一生来应对这个时刻

Hassabis 坦言睡眠很少，情绪复杂。兴奋面：「我在做我梦想中的一切，几乎每月都在科学前沿有新发现。」焦虑面：「我们比任何人都更理解即将发生什么——包括它对’人之为人’这个根本问题的冲击。」

他提到 AlphaGo 击败围棋的”苦乐参半”：围棋是一个美丽的谜团，破解它改变了围棋本身。类似的复杂情感也出现在语言和图像生成领域——对创意艺术工作者而言，10 倍提速的原型设计工具与某些创意技能被替代并存。

关于实验室之间的关系：「我们都互相认识，我跟大多数人关系都不错——虽然有些人彼此不太合得来。这可能是有史以来最激烈的商业竞争，投资人朋友说比互联网泡沫时期还猛 10 倍。但退一步看，比公司成败更重要的东西在等着我们。」

容易被忽略的碎片

DeepMind 与核聚变项目建立了深度合作（新 partnership），用机器学习帮助解决聚变问题，Hassabis 认为聚变一旦实现将解锁大规模海水淡化、火箭燃料生产等连锁效应
AlphaFold 已迎来五周年，Hassabis 提到材料科学（室温超导、更好的电池）是 AI for Science 的下一个重点方向
Hassabis 提到 Gemini Nano/Banana Pro 系统（图像生成工具）搭载了 Gemini，能理解图像的语义内容——比如给一张复杂飞机的照片，能标注所有零件并做爆炸图，他称之为”图像领域的 AGI”
他在业余时间研究物理学理论，探索”信息是宇宙最基本单位”的假说
提到 Santa Fe 研究所早期的网格世界实验：让 Agent 在简单环境中长时间运行，自发发明了市场、银行等制度

名言金句

「也许有收益递减，但人们把它当成非零即一——要么指数增长，要么什么都没有。实际上这两个极端之间有大量空间。」
「目前的系统有点像一个人在状态不好时，脑子里想到什么就直接说出来。大多数时候没问题，但遇到困难问题时你应该停下来，回顾并调整。」
「这次变革的规模可能是工业革命的 10 倍，速度也快 10 倍——不是展开一个世纪，而是十年。」
「没有人在宇宙中发现任何不可计算的东西——至少到目前为止。」
「我的使命一直是帮助世界安全地引导 AGI 跨过终点线，为全人类。完成这个——虽然这只是一份小小的工作——然后我就可以休假了。」

可行建议

关注 Genie + Simmer 的自训练范式：两个 AI 互相交互产生无限训练数据，这可能成为突破数据瓶颈的重要路径
AI 产品设计应优先解决 sycophancy 问题：DeepMind 的”科学人格 + 个性化层”框架值得参考
开始思考后 AGI 经济模型：UBI 只是起点，直接民主型资源分配等新范式值得关注
企业应提前布局 Agent 安全：2-3 年内大量自主 Agent 将上线，网络安全防御需要先行

资源清单

Gemini 3：Google DeepMind 最新大模型
AlphaFold：蛋白质结构预测工具，已发布五周年
Genie：Google DeepMind 的交互式世界模型
Simmer：Google DeepMind 的模拟 Agent 系统（搭载 Gemini）
Veo：Google DeepMind 的视频生成模型
Gemini Nano/Banana Pro：具有语义理解能力的图像生成系统
Isomorphic Labs：Hassabis 创立的 AI 药物发现公司

DeepMindCEO访谈AI短期高估长期低估