从「对话工具」到「知识底座」:「知识胶囊」如何重构产品知识能力与医疗场景落地路径
会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 居斌(浙江数字医疗卫生技术研究院副院长,浙江大学人工智能博士,20+ 年医疗与医药软件开发经验) | 时间: 2026-04-24 下午 · AI 重塑 ToB 产业应用分会场
一句话总结
医疗 AI 产品要走出 RAG”翻书模式”的瓶颈(语义鸿沟、知识库不一致、多轮对话失忆),必须把领域知识结构化、参数化、模块化封装为「知识胶囊」(Knowledge Capsules / KVI 框架),让知识直接进入模型 Attention 计算成为”肌肉记忆”,并以高频高价值科室为切入点构建胶囊市场,未来 AI 医疗的护城河不在模型大,而在「胶囊深、胶囊快、胶囊可组合」。
速览
- 产品三大范式同时切换——交互范式(你点我做 → 你说我做)/ 能力范式(确定性输出 → 生成式智能)/ 开发范式(编写逻辑 → 编排智能)。
- PM 职能跃迁:从流程编排到心智内化——AI Native PM 管理的是「模型心智」,核心资产从结构化数据变为非结构化行业知识 + 概率性推理能力 + 垂直领域权重。
- 中国医疗 AI 的不可能三角——高质量(Clinical Grade)+ 低成本(ROI Positive)+ 高可及(Scaling),传统 SFT 与 RAG 都解不开,必须找新范式。
- 两个标杆案例的两条路径——蚂蚁阿福(To-C 中国大众健康,3,000 万+ 月活)vs OpenEvidence(To-D 全球医生循证决策,76 万+ 注册医生 / 美国 40%+ 执业医师 / 估值 120 亿美元)。
- 从两个标杆得出 4 个结构性启示——用户分层决定一切 / 数据合规是护城河 / 商业模式取决于支付方 / 架构趋势从 RAG 向深度融合演进。
- RAG 范式的 3 个瓶颈——患者「家常话」vs 知识库「学术词」(语义鸿沟)/ 同一疾病多个「标准答案」(知识库不一致)/ 多轮对话「记不住」(无短期记忆)。
- 知识胶囊核心思想:从”翻书”到”肌肉记忆”——把知识压缩为 attention-compatible 的 Key-Value 单元,直接参与模型推理;像 App 一样按需加载 + 热替换,无需重训。
- KVI 三步框架——结构化抽取 → 胶囊化压缩 → External KVI 注入;论文实验中 KVI 在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG。
- 医疗胶囊市场启动:高频高价值科室切入 + 共建 + 市场化运营——从循证指南、药物相互作用、医保规则、科室亚专业、口语-术语映射等胶囊起步。
- 三层竞争力模型——基础层(通用 LLM 同质化)/ 中间层(知识资产胶囊库 = 真正护城河)/ 应用层(场景理解与交互 = PM 主战场)。
核心内容
Module 1:大模型驱动产品范式变革
范式转移:从「你点我做」到「你说我做」——交互的核心从”操作路径设计”转向”意图识别与执行”:
- 传统 GUI · 指令驱动:层层递进(插入 → 图表 → 柱状图 → 选择数据 → 调整颜色)/ 机械操作(手动筛选、排序、编写复杂公式);
- 大模型驱动 · 意图理解:自然语言(“帮我做一个过去三个月的销售柱状图,按产品分类”)/ 智能执行(“找出上季度复购率最高的前 10 个客户”)。
能力范式:从「确定性输出」到「生成式智能」——产品的能力边界从”预设功能”扩展为”动态推理与创造”:
| 对比维度 | 规则执行(旧) | 认知生成(新) |
|---|---|---|
| 逻辑基础 | 固定代码/确定性规则 | 概率分布 + 上下文语义 |
| 典型场景 | 计算器、表单验证 | 文案生成、代码辅助 |
- 旧能力:存储与计算——输入 A 必得 B,逻辑精确但僵化,只能处理预先定义好的场景,无法应对未知变化;
- 新能力:理解与生成——模型基于海量数据和上下文进行推理,输出结果具有创造性、灵活性和强适应性;
- 产品设计逻辑转变——从”提供功能列表”转向”完成用户目标”;从”用户自行判断”转向”系统辅助决策”;
- 风险提示——新能力伴随幻觉、偏见、安全边界模糊等风险,需通过引入专业知识库、人工复核确认、严格权限控制等机制来规避。
开发范式:从「编写逻辑」到「编排智能」——产品研发的核心工作从写 if-else 代码,转向设计提示词、评估模型输出和编排智能体(Agent):
- 传统开发(Code-First):流程为需求分析 → 编写代码 → 测试验证 → 版本发布。痛点:逻辑固化在代码中,业务变更需修改代码并重新发版,迭代周期长;
- 模型驱动开发(Model-Driven):流程为需求定义 → 设计提示词 → 编排工具 → 评估输出 → 迭代上下文。优势:逻辑在提示词与上下文中,变更即改即用,支持业务逻辑的实时敏捷迭代。
PM 职能跃迁:从「流程编排」到「心智内化」——过去的 PM 在管理「用户路径」,AI 时代的 PM 在管理「模型心智」:
| 维度 | 过去 · 信息化 PM | 现在 · AI Native PM |
|---|---|---|
| 核心资产 | 结构化数据、确定性业务逻辑、UI/UX 规范 | 非结构化行业知识、概率性推理能力、垂直领域权重 |
| 核心职能 | 需求定义、原型绘制、功能验收、进度管理(“业务流程的数字化翻译”) | 知识图谱定义、SFT 数据治理、RLHF 偏好设定、模型能力评估(“通用智能的垂直领域塑造者”) |
| 产品力护城河 | 网络效应、用户迁移成本、极致交互体验 | 私有知识的参数化密度、决策确定性、知识更新的 ROI |
从「翻译流程」到「塑造智能」——这是产品经理职能的根本性跃迁。
小结:软件产品从「工具」到「交付者」的跃迁:
- 规模产生质变——参数突破千亿后,涌现出理解、推理、上下文学习等非预设能力,实现质的飞跃;
- 从指令到意图——用户不再需要学习复杂的软件语法,模型能直接理解自然语言背后的真实业务目标;
- 从固定到生成——输出不再局限于预设的选项列表,而是基于输入动态创造全新的文本、代码或图像内容。
PPT 引用了钉钉 CEO 无招的观点:“软件已经进入”日抛""。
Module 2:医疗 AI 应用现状与挑战
中国医疗 AI 的「生死命题」:挑战不可能三角:
三座大山:
- 强监管——容错率几乎为零,要求模型具备「临床级确定性」;
- 公立三甲主导——顶级专家资源垄断,优质服务难以下沉;
- 医保单一支付——DRG/DIP 改革下,非确定性效率提升难商业化。
破局点 · 技术维度:
- ❌ 传统微调 SFT:成本高、易遗忘;
- ❌ RAG 外挂检索:难以保证复杂临床逻辑严密性;
- → 寻找新范式:低成本注入专家私有知识 + 模型内化保证高质量。
唯有通过「知识的低成本、高精度内化」,才能解开中国医疗生态的死结。
医疗 AI 的「标配」:RAG 成为临床知识外挂「大脑」——准确性与实时性高要求下,RAG 凭借外部知识库调用能力成为大模型落地医疗的首选架构:
| 应用 | 名称 | 描述 |
|---|---|---|
| CDSS | 临床决策支持 | 文献类 / 监控类产品都属于 CDSS,有效缓解 LLM 在专业场景下的「幻觉」问题,提供可溯源的辅助建议 |
| Patient Edu | 智能化患者教育 | 用通俗易懂的语言回答患者关于疾病成因、检查流程、康复方案的疑问,提升沟通效率 |
| EMR Auto | 结构化病历生成 | 基于主诉、病史、检验结果,自动生成符合规范的诊疗建议初稿,释放医生文书压力 |
RAG 工作范式:提问 → 向量检索 → 拼接上下文 → LLM 生成 → 带引用的答案。
Module 3:主流 AI 医疗产品分析
医疗 AI 案例解构:蚂蚁阿福 × OpenEvidence——一个深耕中国 C 端「大众健康」,一个锁定全球 D 端「循证决策」,两种完全不同的技术-业务对齐路径。
蚂蚁阿福(To-C · China · Health Companion):
- 3,000 万+ 月活用户(2026 年 1 月);
- 5,000+ 合作医院接入挂号、医保、咨询闭环;
- 目标用户:面向 C 端大众消费者,尤其强调三线及以下城市用户、老年人、家庭用户,以及优质医疗资源相对匮乏的下沉市场人群;挂号就医/医保缴费/健康咨询/健康管理场景打通,形成就医和健康管理服务闭环;
- 目标用户三类:① 慢病长者(高血压/糖尿病/慢阻肺;用药查询、复诊提醒、家属代管);② 年轻家庭(儿童发热、亚健康咨询、体检解读、健康档案);③ 医保/就医用户(通过支付宝流量入口完成挂号-就医-支付-报销-诊后管理的全程就医实时路径及实时服务);
- 核心产品能力:① 健康咨询(多模态提问、AI 诊室主动追问、医学报告解读、皮肤病识别);② 就医服务(线上链接 30 万真人医生、500+ 名医分身;线下智能生成全程就医时路径、语音交互申请医生一站式智慧服务;支付打通医保直付和商保直赔);③ 健康陪伴(家庭健康档案 = 父母/子女健康管理;智能穿戴设备接入);④ 健康管理(用药提醒、健康目标追踪、AI 教练);
- AI 核心技术:专业垂类大模型(多模态:千亿级参数视觉语言识别,与迪安诊断等机构共建 AI 报告生成系统;专业性:依托浙江国家医疗人工智能基地提供模型支持,训练语料超万亿,专注于不同临床子专科的专有 AI 模型,并接入中华医学会杂志等知识库;安全性:隐私安全 = 医疗可信云、密态计算数据可用不可见,算力支持 = 医疗可信、一体机训推一体、国产算力软硬件加速;主动对话 Agent:更懂用户,通过”主动追问”功能实现多轮对话提升回答精准性);
- 蚂蚁模型基础能力三件套:算力(万卡集群)+ 安全力(蚁天鉴一大模型安全一体化解决方案)+ 知识力(千亿级训练语料);
- AI 核心技术总结:主动追问对话 Agent + 多模态(图文、语音、视频)+ 知识图谱+万亿级训练语料;
- 【潜在】商业模式:目前处于用户规模扩张阶段,暂未明确盈利模式,明确无广告和商业排名。
- 医药服务(C):结合好大夫医生生态和阿里医药生态,实现用户从咨询到就医、购药、管理服务的付费转化;
- 会员订阅(C):蚂蚁阿福通过”AI 陪伴”模式将传统低频就医场景转化为高频健康管理需求,实现从咨询、就医、购药到理疗的一站式会员服务;
- 健康险导流(医+药+险闭环)(B):依托支付宝生态,打通”医保直付+商保直赔”金融服务,构建从健康咨询 > 购药 > 理疗的全链路数字化闭环;
- 核心逻辑:以流量免费起量 → 健康档案沉淀 → 医药 + 会员 + B 端三层变现。
OpenEvidence(To-Doctor · Global · Clinical Copilot):
- 76 万+ 注册医生(约 40%+ 全美执业医师已使用);
- 市值 120 亿美元;
- 专注 B 端/专业端,服务对象为经过身份验证的执业医生、护士及医疗专业人员,覆盖全美超 10,000 家医院和医疗中心;为医生提供具备「证据链」的决策支持,突破模型预训练记忆的时效性与准确性限制;
- 目标用户三类(全球 D 端医生 · NPI 实名 · 仅限专业人士):① 一线临床医生(需要快速查询最新指南、RCT 证据;为床旁决策服务);② 住院医/医学生(替代碎片化 UpToDate / PubMed 查询,学习式问答);③ 专科医生与研究者(疑难病多跳推理;深度综述 DeepConsult 代替文献综述);
- 准入门槛:NPI 号码 / 医师执照验证 · 确保每一位用户都是「持证专业人士」;
- 核心产品能力:① 循证问答(每条结论附 PubMed 级引用,可一键跳转原文);② DeepConsult Agent(多研究文献深度推理,AI 智能体专为临床决策设计,免费向认证医生开放);③ 证据实时更新(指南 / RCT 每日入库,检索 3500 万篇同行评审论文,5-10 秒内返回带引用的循证答案);④ 工作流集成(与 EMR、UpToDate 并行,不打断诊疗节奏);
- AI 核心技术:多模型融合 + 实时神经检索 + Agentic DeepConsult:
| 层 | 内容 |
|---|---|
| 用户层 | 医生自然语言问诊 · 临床上下文填充 |
| Agent 层 | DeepConsult 多步规划 + 执行 + 验证 |
| 模型层 | GPT / Claude / Gemini 融合调度 + 医学微调 |
| 知识层 | 35,000+ 期刊 · 实时向量检索 + 结构化引用 |
★ 关键差异化:把「引用链」当作一等公民,生成即带证据,天然抗幻觉。
- 商业模式:医生免费 + 药企/医疗器械付费广告:
| 模式 | 内容 | 数据 |
|---|---|---|
| ① Pharma Ads | 药企上下文精准投放:CPM $70-$1,000+,远高于一般数字广告 | > $100M ARR(2025) |
| ② Sponsored Content | 疾病教育、指南解读的品牌内容合作,与循证问答场景原生融合 | $150M+ ARR(2026 E) |
| ③ Enterprise | 医院/保险机构/药厂 API 授权;临床试验招募与市场研究 | $12B 最新估值 |
核心逻辑:把「医生注意力」变成最稀缺的广告资产——零订阅 → 规模 → 高 CPM。
从两个标杆看整个 AI 医疗行业:四个结构性启示:
| 维度 | 蚂蚁阿福(To-C) | OpenEvidence(To-D) |
|---|---|---|
| 目标用户 | 中国 C 端大众 | 全球 D 端医生 |
| 核心能力 | 陪伴式健康管家 · 就医闭环 | 循证决策 Copilot · 证据链 |
| AI 技术 | Multi-Agent + Prompt Fence | 多模型融合 + 实时神经检索 |
| 商业模式 | 医药 + 会员 + B 端(C+B 双轮) | 药企广告 + 企业授权(D 端免费) |
四个结构性启示:
- 用户分层决定一切——C 端要「陪伴感 + 合规围栏」,D 端要「证据链 + 专业深度」;没有「通吃」的医疗 AI;
- 数据合规是护城河——NPI 验证、围栏提示、引用溯源——合规不是约束,而是 AI 医疗赢得信任的产品形态;
- 商业模式取决于支付方——C 端依赖「流量生态 + 会员」;D 端依赖「药企营销预算」——谁为知识付费,决定产品形态;
- 架构趋势:从 RAG 向深度融合演进——两家都在突破「拼接式 RAG」:或用 Multi-Agent 编排,或用 Agentic DeepConsult——方向都指向「知识与模型融合」。
Module 4:「知识外挂」RAG 范式的瓶颈
瓶颈一:患者的「家常话」 vs 知识库的「学术词」
核心痛点:患者描述症状时使用生活化口语,而医学知识库存储的是高度标准化的专业术语,导致向量检索无法在语义空间中有效对齐。
举例:
- 患者口语化表达:“这两天总觉得胸口闷闷的,像压了块大石头一样,活动量大一点就有点喘不上气…”;
- 医学知识库标准术语:胸闷、胸骨后压榨感、劳力性心绞痛、呼吸困难、心肌缺血体征……
- RAG 检索失效结果:因无法将”压了块石头”映射到”压榨感”,向量召回片段缺失或相关性极低,无法辅助诊断。
语义鸿沟产生的根本原因:① 口语与医学本体存在天然语义断层;② 通用向量模型对医学长尾口语理解不足;③ 知识库缺乏显式的”口语-术语”映射层。
瓶颈二:同一疾病,多个「标准答案」
核心洞察:知识库的”不一致性”——医学知识库中充斥着版本差异、科室用药偏好、专家共识分歧,传统 RAG 无法有效处理这些逻辑冲突,导致回答失效。
举例:
- 医生提问:65 岁高血压合并糖尿病,首选降压药?
- 知识库召回:指南推荐 ACEI/ARB,专家共识推荐 CCB,说明书提示 ACEI 禁忌;
- ❌ RAG 结果:输出”视患者具体情况而定”,无法给出明确的用药建议。
冲突来源三类:① 专家经验(临床指南有模棱两可地方,对同一病症的专家经验有习惯差异);② 生活质量需求(需长期治疗者,口服方案更具优势);③ 经济因素(官方指南、治疗方案与患者经济承担能力之间的博弈)。
瓶颈三:RAG「记不住」多轮对话中的动态信息
核心痛点:“失忆”的检索机制——RAG 每次检索都是”重新开始”,无法有效利用同一患者在多轮问诊中持续产生的上下文信息。
场景还原:糖尿病患者连续 4 周问诊:
- 行为:每次提问都重新检索静态知识库,前三周的动态信息被”遗忘”;
- 结果:模型不知患者已自行减药,只能机械回答”请遵医嘱”,无针对性。
机制缺陷:
- 无”短期记忆”能力——每轮检索相互独立,无法建立会话内的信息关联;
- 数据壁垒:动态信息难入静态库——病程变化是动态的,无法实时同步到静态的知识库中。
PPT 引用 HippoRAG 2: From RAG to Memory(公众号 agiled)作为业界对此问题的探索。
Module 5:「知识胶囊」:让知识进入模型计算核心
什么是「知识胶囊」:从「翻书」到「肌肉记忆」
将领域知识结构化、参数化、模块化地封装,使其直接参与模型 Attention 计算。
| 维度 | RAG · 知识外挂(翻书模式) | 知识内化(肌肉记忆模式) |
|---|---|---|
| 形象类比 | 大脑 → 外部知识库 | 大脑内部存储(Brain 内含 KV 单元) |
| 工作机制 | 知识作为「文本 Tokens」拼入上下文,在 Attention 中与其他 Tokens 竞争;间接、不稳定,尤其在长上下文和多跳推理时失效 | 知识被压缩为 Attention 可计算的 Key-Value 单元,直接参与模型推理;像「肌肉记忆」一样即插即用,冻结底座无需重训 |
三个核心机制:
- 结构化封装——从语料中抽取归一化的关系型知识单元;
- 参数化注入——编码为 attention-compatible 的 Key-Value;
- 可插拔组合——按需加载 + 热替换,知识像 App 一样管理。
技术原理:KVI 框架——让知识直接参与 Attention 计算
把胶囊编译进模型的注意力机制。论文:Knowledge Capsules: Structured Nonparametric Memory Units for LLMs(Bin Ju, Shenheng Weng, Danying Zhou, Kunkai Su;浙江大学 / MiniMax / 中新中以联合实验室)。
KVI(Knowledge Vector Injection)三步骤:
- STEP 1 结构化抽取——从指南、文献、病例中抽取归一化的 relational knowledge units(冻结底座模型完成);
- STEP 2 胶囊化压缩——将知识单元编译为 attention-compatible 的 Key-Value 表征,封装成可管理、可版本化的胶囊;
- STEP 3 External KVI 注入——推理时按需加载胶囊,Key-Value 直接参与 Attention 计算——知识级集成替代上下文级拼接。
代码地址:https://github.com/jubin76/KVI
能力对比:知识胶囊 vs RAG——RAG 解决「AI 不知道」;知识胶囊解决「AI 不会用」。
| 对比维度 | RAG · 知识外挂 | Knowledge Capsule · 知识内化 |
|---|---|---|
| 知识形态 | 文本片段 Tokens | 参数化 Key-Value 模块 |
| 推理深度 | 拼接式,长上下文易丢失 | 融合式,直接进入 Attention 计算 |
| 多跳与长上下文 | 稳定性弱,易幻觉 | 稳定性与准确性显著提升 |
| 更新方式 | 重建向量索引 | 替换 / 热插拔胶囊 |
| 成本结构 | Token + 向量库 + 重排 | 一次编译,多次调用,无需微调 |
| 可组合性 | 弱,检索片段难组合 | 强,胶囊可叠加、按场景编排 |
在论文实验中,KVI 范式在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG,且无需参数更新。
医疗场景落地:从「单胶囊」到「胶囊市场」
以高频高价值科室切入,共建 + 市场化运营,形成可持续的知识资产体系。
医疗知识胶囊库示例:
- 循证指南胶囊:心内、肿瘤、内分泌……;
- 药物相互作用胶囊:DDI + 禁忌识别;
- 医保规则胶囊:DRG/DIP + 控费;
- 科室亚专业胶囊:房颤 / 糖尿病 / AKI;
- 口语-术语映射胶囊:解决语义鸿沟。
三步走策略:
- 切入:高频高价值科室——选择心内、肿瘤、内分泌等,高循证依赖 + 高错误代价 + 明确付费方;
- 共建:与医院 / 学会协作——和三甲专家共建胶囊内容,解决数据壁垒与专业深度,胶囊 IP 归属与分润清晰;
- 市场化:胶囊市场 + 平台生态——开放胶囊标准,第三方可贡献专业胶囊;平台抽佣 + 医院订阅,形成正反馈。
Module 6:未来 AI 医疗产品的核心竞争力
三层竞争力模型 & 给 PM 的三条行动建议
产品经理的战场:从「功能差异化」升级到「知识资产差异化」。
应用层
场景理解与交互 · PM 主战场
─────────────────────────
中间层 · 知识资产胶囊库 ★ 真正的护城河
私有知识参数化密度 · 决策确定性 · 更新 ROI
─────────────────────────
基础层
通用 LLM 模型能力 · 正在同质化
未来 AI 医疗产品的竞争不在「谁的模型大」,而在「谁的胶囊深、胶囊快、胶囊可组合」。
给 PM 的三条行动建议:
- 知识即产品——把「领域知识的结构化 + 胶囊化」写进产品路线图,与功能需求同等优先级;
- 领域即壁垒——深耕一个场景,胜过浅做十个——胶囊深度正比于垂直深度;
- 胶囊即资产——建立胶囊的版本管理、评估体系、商业模式——像代码资产一样经营知识。
关键金句
「未来 AI 医疗产品的竞争不在『谁的模型大』,而在『谁的胶囊深、胶囊快、胶囊可组合』。」——居斌
「过去的 PM 在管理『用户路径』,AI 时代的 PM 在管理『模型心智』。」——居斌
「RAG 解决『AI 不知道』;知识胶囊解决『AI 不会用』。」——居斌
「合规不是约束,而是 AI 医疗赢得信任的产品形态。」——居斌(结构性启示二)
「软件已经进入”日抛”。」——无招(钉钉 CEO,被 PPT 引用)
可行建议
- 把”领域知识的结构化 + 胶囊化”列入产品路线图,和功能需求同优先级;
- 深耕一个高频高价值场景(心内/肿瘤/内分泌等),不要浅做十个;
- 建立胶囊的版本管理、评估体系、商业模式——把知识当代码资产经营;
- 做医疗 AI 必须先回答:用户分层(C 端要陪伴/合规围栏,D 端要证据链/专业深度)、合规链路(NPI 验证/围栏提示/引用溯源)、支付方画像(流量+会员 vs 药企营销预算);
- 突破 RAG 三大瓶颈的工程化思路:
- 解决语义鸿沟:建口语-术语映射胶囊;
- 解决知识库不一致:用胶囊带版本号 + 优先级调度;
- 解决多轮失忆:引入 HippoRAG 类的”短期记忆”机制 + 患者会话内动态胶囊;
- KVI 论文 & 代码:Knowledge Capsules: Structured Nonparametric Memory Units for LLMs,https://github.com/jubin76/KVI
关键数据/案例索引
核心产品/品牌:
- 蚂蚁阿福(支付宝旗下医疗 AI 助手)
- OpenEvidence(美国医生循证决策 Copilot)
- 浙江数字医疗卫生技术研究院
- 浙江国家医疗人工智能基地
- 蚁天鉴(蚂蚁大模型安全一体化解决方案)
- 钉钉(无招引用)
- HippoRAG 2: From RAG to Memory(公众号 agiled)
- 迪安诊断(蚂蚁阿福 AI 报告生成系统合作方)
- 中华医学会杂志社、好大夫医生生态、阿里医药生态
关键数字:
- 蚂蚁阿福 3,000 万+ 月活(2026 年 1 月)、5,000+ 合作医院、30 万真人医生、500+ 名医分身
- OpenEvidence 76 万+ 注册医生、约 40%+ 全美执业医师、覆盖全美超 10,000 家医院、市值 120 亿美元、35,000+ 期刊、检索 3,500 万篇论文、5-10 秒返回带引用循证答案
- OpenEvidence 商业:Pharma Ads CPM $70-$1,000+、>$100M ARR (2025)、Sponsored Content $150M+ ARR (2026 E)、Enterprise $12B 估值
- 蚂蚁阿福训练语料 > 万亿、参数千亿级
- KVI 论文实验:在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG,无需参数更新
核心技术名词:
- KVI(Knowledge Vector Injection)框架
- Knowledge Capsules(知识胶囊)
- Key-Value 注入、Attention 计算
- RAG(Retrieval Augmented Generation)
- GraphRAG
- Multi-Agent + Prompt Fence
- Agentic DeepConsult
- 实时神经检索
- HippoRAG 2
- CDSS(临床决策支持)
- EMR(电子病历)
- DDI(药物相互作用)
- DRG/DIP(医保支付改革)
- NPI(美国国家医疗服务提供者识别号)
- SFT(Supervised Fine-Tuning)
- RLHF(基于人类反馈的强化学习)
模型供应商:GPT、Claude、Gemini(OpenEvidence 多模型融合);蚂蚁专业垂类大模型(千亿级参数)
论文/代码:
- Knowledge Capsules: Structured Nonparametric Memory Units for LLMs(作者:Bin Ju、Shenheng Weng、Danying Zhou、Kunkai Su;机构:浙江大学 / MiniMax / 中新中以联合实验室)
- 代码:https://github.com/jubin76/KVI
讲者背景:
- 浙江大学人工智能博士、高级工程师
- 中华医学会数字医学分会委员
- 浙江省人工智能发展专家委员会医疗健康大数据专项小组成员
- 浙江省卫生信息协会医疗大数据与人工智能专委会委员
- 20+ 年医疗与医药软件开发经验
- 浙江省政府科学技术进步一等奖 1 项 / 二等奖 1 项
- 发表 21 篇 SCI、3 篇 EI,授权发明专利 10 项
胶囊库示例:循证指南 / 药物相互作用 / 医保规则 / 科室亚专业 / 口语-术语映射
5 阶段进化路径(无明确 L1-L5 定义,PPT 主要按”瓶颈 → 解法”组织,省略阶段化总结)
三层竞争力模型:基础层(通用 LLM)/ 中间层(知识资产胶囊库 = 护城河)/ 应用层(场景理解与交互 = PM 主战场)