jixiaxue 知识库
blog / pm-conference-2026-04-blog · sessions / 2026-04-24-pm-bigtech-up-04-wuqiuxuan-ai-glasses

AI 眼镜上的多模态:从感知外部世界到读懂人类大脑

0 个章节 · 0 条产出 · 0 条证据
2026-04-24

AI 眼镜上的多模态:从感知外部世界到读懂人类大脑

会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 吴秋璇 Eileen Wu(Google AI & Glasses Product Lead) | 时间: 2026-04-24 下午 · 大厂 AI 产品探索分会场

一句话总结

多模态 AI 与眼镜是天作之合——眼镜解放双手、共享视野、融入现实、提供新交互;下一步 BCI(脑机接口)将让眼镜从”感知外部世界”进化到”感知人的大脑”,由”外部 + 内部”双重感知共同决策”正确时间、正确方式、正确内容”的交互。

速览

  1. 手机时代的产品逻辑正在失效——真正有用的 AI 助手需要解放双手。
  2. 眼镜的四大核心突破——解放双手、共享视野、融入现实、新的交互(系统主动出现)。
  3. 眼镜上多模态 AI 的三大核心能力——环境理解、意图推断、适时输出。
  4. 五大产品挑战——延迟、电量、隐私、信息过载、生态系统,都是从 2012 谷歌眼镜到 2026 眼镜市场的核心瓶颈。
  5. BCI + XR 是下一代范式——眼镜从感知世界扩展到感知大脑。
  6. 三个认知维度是手机时代完全看不见的信号——专注度、焦虑度、疲惫度,分别决定信息何时出现、信息密度与措辞、交互复杂程度。
  7. 双重感知模型——外部感知(视觉/语音/空间/场景/物体/文字/环境动态变化)+ 内部感知(专注度/焦虑度/认知负荷/情绪/注意力状态)共同决策交互方式。
  8. 产品里的认知感知设计三原则——系统主动性、注意力预算、无感体验。
  9. 职业心法——识别”公司赌注”(Big Bets)+ 把热情当作”抗风险工具”。
  10. 做重要的事 + 做热爱的事——讲者总结的产品人成长法则。

核心内容

讲者背景:5 步成长轨迹

  • 第一次实习:AR in Edu(教育领域 AR)
  • 研究经验:Haptic Glove、Construction、BCI + XR
  • 产品经理:在 Worked on multiple billion users products
  • 现在:XR — Build new interaction paradigms between human and AI
  • 配图包括 Google 实习获奖照、手套硬件设计图、HoloLens 2 头显(embedded brain sensing component over visual cortex / Scene generated based on user’s brain activity / User wearing the system)、超市/家居场景拍摄
  • 引用 https://www.android.com/xr/,对应 Google Android XR 平台

第一章:为什么多模态 AI 最好的使用产品是眼镜

手机 vs AI 眼镜的 6 维对比

维度手机AI 眼镜
交互方式点击 / 滑动 / 打字语音 / 视线 / 手势 / 动作
信息呈现屏幕对应现实物体
触发时机用户主动打开手机、App系统判断何时出现
注意力低头专注屏幕把注意力放在真实世界
上下文间接看见你所见、你所听直接看见你所见、你所听
助手角色工具,随用随关全天候的协作者,伙伴

定调:“真正有用的 AI 助手,需要解放双手”——手机时代的产品逻辑正在失效。

眼镜的核心突破——4 个维度 眼镜是第一个真正与物理世界无缝融合的计算平台:

  1. 解放双手:用户的手是自由的,可以做真实世界的事
  2. 共享视野:AI 看到你看到的、听到你听到的
  3. 融入现实:信息不在屏幕里,而是叠加在真实世界上
  4. 新的交互:AI 在正确时刻主动出现

第二章:现在——多模态 AI 在眼镜上能做什么

三大核心能力

能力定义子能力
环境理解看懂你面前的世界场景识别(室内/室外/道路/商场)、物体识别与文字理解、空间关系与距离感知、实时动态变化捕捉
意图推断知道你真正需要什么结合语音指令 + 视觉上下文、推断任务目标而非字面指令、历史行为 + 当前场景融合、多轮对话的连续理解
适时输出在对的时刻以对的方式出现什么时候该说话、信息密度随场景动态调整、视觉/语音/触觉多通道选择、不打断用户最重要的事

产品路上的五大挑战(2012 谷歌眼镜 → 2026 眼镜市场)

挑战需要解决的问题
延迟AI 推理速度和准确度 vs 实时体验感
电量多模态感知耗电巨大
隐私摄像头持续拍摄引发信任危机
信息过载信息太多会抢占注意力,应尽早探究具身智能对人的长期影响
生态系统需要建立全新的、适于开发的生态系统

讲者把这五条作为眼镜从 demo 到大规模产品的路障清单——任何一项不解决,眼镜都不会变成第二台手机。

第三章:未来——BCI 让眼镜从感知世界到感知大脑

思想实验:假设眼镜能实时感知你的认知状态

维度低端表现高端表现产品决策
专注度低 → 注意力涣散高 → 高度集中决定信息何时出现
焦虑度低 → 平静放松高 → 高度紧张决定信息密度与措辞
疲惫度低 → 精力充沛高 → 极度疲劳决定交互的复杂程度

讲者强调:“这三个维度,是手机时代产品完全看不见的信号”——这是 BCI + XR 想要打开的全新信号通道。

从实验室到产品想象

BCI x XR 研究

  • AttentivU + XR、NeuroSkill —— MIT Media Lab
  • Meta Neural Band + Orion —— Nature & Reality Labs
  • “A review on Virtual Reality and Augmented Reality use-cases of Brain Computer Interface based applications for smart cities” —— Varun Kohli and more

BCI x XR 产品化应用

  • 焦虑时 → 信息密度自动降低
  • 专注时 → 推送更深度的内容
  • 疲惫时 → 切换更简单的交互模式

双重感知模型——讲者最核心的产品框架

感知外部世界                          感知人的大脑
┌──────────────┐    ┌──────────┐    ┌──────────────┐
│ 视觉·语音·空间 │ ── │共同决策    │ ── │ 专注度·焦虑度  │
│ 场景·物体·文字 │    │交互方式    │    │ 认知负荷·情绪  │
│ 环境动态变化   │    └──────────┘    │ 注意力状态    │
└──────────────┘          │           └──────────────┘

              正确时间 · 正确方式 · 正确内容

外部感知告诉系统”现实世界正在发生什么”,内部感知告诉系统”用户大脑现在能承受什么”——两端共同决策出”正确时间、正确方式、正确内容”。

产品里的”认知感知”设计思路

原则含义落地方法
系统主动性从”用户召唤”到”主动介入”触发逻辑:识别场景 → 判断介入 → 选择模态。不再等待 App 打开,而是在物理世界中实时决定交互逻辑
注意力预算认知负荷可以是新的”加载速度”认知心理学:信息出现时机与精神健康保护。比如利用 EEG 调整信息密度,优化注意力分配
无感体验设计”退出”与”消失”眼镜追求”恰到好处地消失”。眼镜需要在用户什么都不需要的时候,实现无感体验

第四章:体会分享——做重要的事 + 做热爱的事

职业成长的两条心法

① 识别”公司赌注”(Big Bets)

  • 赌注是多年的战略布局,而非季度优先级
  • 做赌注级项目:虽然不确定性高,但容错空间更大,是大公司里成长最快的”极限环境”

② 热情是”抗风险工具”

  • 在没有答案的时候支撑你”不放弃”
  • 当新硬件没有成熟的指标和竞品,当几个季度没有数据增长时,只有真正的兴趣能保住你的使命感
  • 热情不是为了让你”更努力”,而是为了让你在迷雾中保持判断力

讲者用这两条心法把第一章”我的经历”和第三章”BCI 的远景”串起来——做眼镜这种长周期、高不确定性的产品,需要靠”重要 + 热爱”两个发动机才走得远。

关键金句

「真正有用的 AI 助手,需要解放双手」——吴秋璇 「眼镜需要在用户什么都不需要的时候,实现无感体验」——吴秋璇 「专注度、焦虑度、疲惫度——这三个维度,是手机时代产品完全看不见的信号」——吴秋璇 「赌注是多年的战略布局,而非季度优先级」——吴秋璇 「热情不是为了让你”更努力”,而是为了让你在迷雾中保持判断力」——吴秋璇

可行建议

  • 评估眼镜产品的设计起点,从”系统判断何时出现”而非”用户召唤”出发,把 App 思维换成”识别场景 → 判断介入 → 选择模态”的触发逻辑链
  • 任何眼镜产品发布前先做五项检查:延迟、电量、隐私、信息过载、生态系统——任意一项未达标,都还不是大众产品
  • 多模态信息密度做动态化设计,参考 EEG/认知负荷信号;不要让”加载速度”只衡量技术延迟,把”认知加载速度”也当 KPI
  • 探索 BCI + XR 时,先从”读取”信号做起(专注/焦虑/疲惫),不要急着做”写入”
  • PM 选项目:识别公司多年的”Big Bets”投入——这些项目容错空间大、成长最快;同时保留对它的真实热情,这是穿越无数据期的工具

关键数据/案例索引

核心框架

  • 手机 vs AI 眼镜 6 维对比(交互方式 / 信息呈现 / 触发时机 / 注意力 / 上下文 / 助手角色)
  • 眼镜核心突破 4 维(解放双手 / 共享视野 / 融入现实 / 新的交互)
  • 多模态 AI 三大核心能力(环境理解 / 意图推断 / 适时输出)
  • 产品路上五大挑战(延迟 / 电量 / 隐私 / 信息过载 / 生态系统)
  • 双重感知模型(外部感知 + 内部感知 + 共同决策)
  • 三大认知维度(专注度 / 焦虑度 / 疲惫度)
  • 认知感知设计 3 原则(系统主动性 / 注意力预算 / 无感体验)

研究引用

  • AttentivU + XR、NeuroSkill —— MIT Media Lab
  • Meta Neural Band + Orion —— Nature & Reality Labs
  • “A review on Virtual Reality and Augmented Reality use-cases of Brain Computer Interface based applications for smart cities” —— Varun Kohli and more
  • Android XR 平台:https://www.android.com/xr/

讲者经历的项目

  • AR in Edu(教育 AR,第一次实习)
  • Haptic Glove(手套硬件设计稿)
  • Construction BCI + XR(HoloLens 2 + brain sensing component over visual cortex 实验:Scene generated based on user’s brain activity)
  • Worked on multiple billion users products(产品经理阶段)
  • 现在:Build new interaction paradigms between human and AI(XR)

讲者背景

  • Eileen Wu(吴秋璇)
  • 现职:Product Lead, AI & Glasses · Google
  • 关注方向:探索新的人与世界的交互方式

对标参考

  • 2012 年的谷歌眼镜(早期教训)→ 2026 年的眼镜市场
  • 大公司 Big Bets 模型:把多年战略下注作为 PM 选项目的标准