AI 眼镜上的多模态:从感知外部世界到读懂人类大脑
会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 吴秋璇 Eileen Wu(Google AI & Glasses Product Lead) | 时间: 2026-04-24 下午 · 大厂 AI 产品探索分会场
一句话总结
多模态 AI 与眼镜是天作之合——眼镜解放双手、共享视野、融入现实、提供新交互;下一步 BCI(脑机接口)将让眼镜从”感知外部世界”进化到”感知人的大脑”,由”外部 + 内部”双重感知共同决策”正确时间、正确方式、正确内容”的交互。
速览
- 手机时代的产品逻辑正在失效——真正有用的 AI 助手需要解放双手。
- 眼镜的四大核心突破——解放双手、共享视野、融入现实、新的交互(系统主动出现)。
- 眼镜上多模态 AI 的三大核心能力——环境理解、意图推断、适时输出。
- 五大产品挑战——延迟、电量、隐私、信息过载、生态系统,都是从 2012 谷歌眼镜到 2026 眼镜市场的核心瓶颈。
- BCI + XR 是下一代范式——眼镜从感知世界扩展到感知大脑。
- 三个认知维度是手机时代完全看不见的信号——专注度、焦虑度、疲惫度,分别决定信息何时出现、信息密度与措辞、交互复杂程度。
- 双重感知模型——外部感知(视觉/语音/空间/场景/物体/文字/环境动态变化)+ 内部感知(专注度/焦虑度/认知负荷/情绪/注意力状态)共同决策交互方式。
- 产品里的认知感知设计三原则——系统主动性、注意力预算、无感体验。
- 职业心法——识别”公司赌注”(Big Bets)+ 把热情当作”抗风险工具”。
- 做重要的事 + 做热爱的事——讲者总结的产品人成长法则。
核心内容
讲者背景:5 步成长轨迹
- 第一次实习:AR in Edu(教育领域 AR)
- 研究经验:Haptic Glove、Construction、BCI + XR
- 产品经理:在 Worked on multiple billion users products
- 现在:XR — Build new interaction paradigms between human and AI
- 配图包括 Google 实习获奖照、手套硬件设计图、HoloLens 2 头显(embedded brain sensing component over visual cortex / Scene generated based on user’s brain activity / User wearing the system)、超市/家居场景拍摄
- 引用 https://www.android.com/xr/,对应 Google Android XR 平台
第一章:为什么多模态 AI 最好的使用产品是眼镜
手机 vs AI 眼镜的 6 维对比
| 维度 | 手机 | AI 眼镜 |
|---|---|---|
| 交互方式 | 点击 / 滑动 / 打字 | 语音 / 视线 / 手势 / 动作 |
| 信息呈现 | 屏幕 | 对应现实物体 |
| 触发时机 | 用户主动打开手机、App | 系统判断何时出现 |
| 注意力 | 低头专注屏幕 | 把注意力放在真实世界 |
| 上下文 | 间接看见你所见、你所听 | 直接看见你所见、你所听 |
| 助手角色 | 工具,随用随关 | 全天候的协作者,伙伴 |
定调:“真正有用的 AI 助手,需要解放双手”——手机时代的产品逻辑正在失效。
眼镜的核心突破——4 个维度 眼镜是第一个真正与物理世界无缝融合的计算平台:
- 解放双手:用户的手是自由的,可以做真实世界的事
- 共享视野:AI 看到你看到的、听到你听到的
- 融入现实:信息不在屏幕里,而是叠加在真实世界上
- 新的交互:AI 在正确时刻主动出现
第二章:现在——多模态 AI 在眼镜上能做什么
三大核心能力
| 能力 | 定义 | 子能力 |
|---|---|---|
| 环境理解 | 看懂你面前的世界 | 场景识别(室内/室外/道路/商场)、物体识别与文字理解、空间关系与距离感知、实时动态变化捕捉 |
| 意图推断 | 知道你真正需要什么 | 结合语音指令 + 视觉上下文、推断任务目标而非字面指令、历史行为 + 当前场景融合、多轮对话的连续理解 |
| 适时输出 | 在对的时刻以对的方式出现 | 什么时候该说话、信息密度随场景动态调整、视觉/语音/触觉多通道选择、不打断用户最重要的事 |
产品路上的五大挑战(2012 谷歌眼镜 → 2026 眼镜市场)
| 挑战 | 需要解决的问题 |
|---|---|
| 延迟 | AI 推理速度和准确度 vs 实时体验感 |
| 电量 | 多模态感知耗电巨大 |
| 隐私 | 摄像头持续拍摄引发信任危机 |
| 信息过载 | 信息太多会抢占注意力,应尽早探究具身智能对人的长期影响 |
| 生态系统 | 需要建立全新的、适于开发的生态系统 |
讲者把这五条作为眼镜从 demo 到大规模产品的路障清单——任何一项不解决,眼镜都不会变成第二台手机。
第三章:未来——BCI 让眼镜从感知世界到感知大脑
思想实验:假设眼镜能实时感知你的认知状态
| 维度 | 低端表现 | 高端表现 | 产品决策 |
|---|---|---|---|
| 专注度 | 低 → 注意力涣散 | 高 → 高度集中 | 决定信息何时出现 |
| 焦虑度 | 低 → 平静放松 | 高 → 高度紧张 | 决定信息密度与措辞 |
| 疲惫度 | 低 → 精力充沛 | 高 → 极度疲劳 | 决定交互的复杂程度 |
讲者强调:“这三个维度,是手机时代产品完全看不见的信号”——这是 BCI + XR 想要打开的全新信号通道。
从实验室到产品想象
BCI x XR 研究
- AttentivU + XR、NeuroSkill —— MIT Media Lab
- Meta Neural Band + Orion —— Nature & Reality Labs
- “A review on Virtual Reality and Augmented Reality use-cases of Brain Computer Interface based applications for smart cities” —— Varun Kohli and more
BCI x XR 产品化应用
- 焦虑时 → 信息密度自动降低
- 专注时 → 推送更深度的内容
- 疲惫时 → 切换更简单的交互模式
双重感知模型——讲者最核心的产品框架
感知外部世界 感知人的大脑
┌──────────────┐ ┌──────────┐ ┌──────────────┐
│ 视觉·语音·空间 │ ── │共同决策 │ ── │ 专注度·焦虑度 │
│ 场景·物体·文字 │ │交互方式 │ │ 认知负荷·情绪 │
│ 环境动态变化 │ └──────────┘ │ 注意力状态 │
└──────────────┘ │ └──────────────┘
▼
正确时间 · 正确方式 · 正确内容
外部感知告诉系统”现实世界正在发生什么”,内部感知告诉系统”用户大脑现在能承受什么”——两端共同决策出”正确时间、正确方式、正确内容”。
产品里的”认知感知”设计思路
| 原则 | 含义 | 落地方法 |
|---|---|---|
| 系统主动性 | 从”用户召唤”到”主动介入” | 触发逻辑:识别场景 → 判断介入 → 选择模态。不再等待 App 打开,而是在物理世界中实时决定交互逻辑 |
| 注意力预算 | 认知负荷可以是新的”加载速度” | 认知心理学:信息出现时机与精神健康保护。比如利用 EEG 调整信息密度,优化注意力分配 |
| 无感体验 | 设计”退出”与”消失” | 眼镜追求”恰到好处地消失”。眼镜需要在用户什么都不需要的时候,实现无感体验 |
第四章:体会分享——做重要的事 + 做热爱的事
职业成长的两条心法
① 识别”公司赌注”(Big Bets)
- 赌注是多年的战略布局,而非季度优先级
- 做赌注级项目:虽然不确定性高,但容错空间更大,是大公司里成长最快的”极限环境”
② 热情是”抗风险工具”
- 在没有答案的时候支撑你”不放弃”
- 当新硬件没有成熟的指标和竞品,当几个季度没有数据增长时,只有真正的兴趣能保住你的使命感
- 热情不是为了让你”更努力”,而是为了让你在迷雾中保持判断力
讲者用这两条心法把第一章”我的经历”和第三章”BCI 的远景”串起来——做眼镜这种长周期、高不确定性的产品,需要靠”重要 + 热爱”两个发动机才走得远。
关键金句
「真正有用的 AI 助手,需要解放双手」——吴秋璇 「眼镜需要在用户什么都不需要的时候,实现无感体验」——吴秋璇 「专注度、焦虑度、疲惫度——这三个维度,是手机时代产品完全看不见的信号」——吴秋璇 「赌注是多年的战略布局,而非季度优先级」——吴秋璇 「热情不是为了让你”更努力”,而是为了让你在迷雾中保持判断力」——吴秋璇
可行建议
- 评估眼镜产品的设计起点,从”系统判断何时出现”而非”用户召唤”出发,把 App 思维换成”识别场景 → 判断介入 → 选择模态”的触发逻辑链
- 任何眼镜产品发布前先做五项检查:延迟、电量、隐私、信息过载、生态系统——任意一项未达标,都还不是大众产品
- 多模态信息密度做动态化设计,参考 EEG/认知负荷信号;不要让”加载速度”只衡量技术延迟,把”认知加载速度”也当 KPI
- 探索 BCI + XR 时,先从”读取”信号做起(专注/焦虑/疲惫),不要急着做”写入”
- PM 选项目:识别公司多年的”Big Bets”投入——这些项目容错空间大、成长最快;同时保留对它的真实热情,这是穿越无数据期的工具
关键数据/案例索引
核心框架
- 手机 vs AI 眼镜 6 维对比(交互方式 / 信息呈现 / 触发时机 / 注意力 / 上下文 / 助手角色)
- 眼镜核心突破 4 维(解放双手 / 共享视野 / 融入现实 / 新的交互)
- 多模态 AI 三大核心能力(环境理解 / 意图推断 / 适时输出)
- 产品路上五大挑战(延迟 / 电量 / 隐私 / 信息过载 / 生态系统)
- 双重感知模型(外部感知 + 内部感知 + 共同决策)
- 三大认知维度(专注度 / 焦虑度 / 疲惫度)
- 认知感知设计 3 原则(系统主动性 / 注意力预算 / 无感体验)
研究引用
- AttentivU + XR、NeuroSkill —— MIT Media Lab
- Meta Neural Band + Orion —— Nature & Reality Labs
- “A review on Virtual Reality and Augmented Reality use-cases of Brain Computer Interface based applications for smart cities” —— Varun Kohli and more
- Android XR 平台:https://www.android.com/xr/
讲者经历的项目
- AR in Edu(教育 AR,第一次实习)
- Haptic Glove(手套硬件设计稿)
- Construction BCI + XR(HoloLens 2 + brain sensing component over visual cortex 实验:Scene generated based on user’s brain activity)
- Worked on multiple billion users products(产品经理阶段)
- 现在:Build new interaction paradigms between human and AI(XR)
讲者背景
- Eileen Wu(吴秋璇)
- 现职:Product Lead, AI & Glasses · Google
- 关注方向:探索新的人与世界的交互方式
对标参考
- 2012 年的谷歌眼镜(早期教训)→ 2026 年的眼镜市场
- 大公司 Big Bets 模型:把多年战略下注作为 PM 选项目的标准