jixiaxue 知识库
blog / pm-conference-2026-04-blog · sessions / 2026-04-24-pm-tob-05-jubin-knowledge-base

从「对话工具」到「知识底座」:「知识胶囊」如何重构产品知识能力与医疗场景落地路径

0 个章节 · 0 条产出 · 0 条证据
2026-04-24

从「对话工具」到「知识底座」:「知识胶囊」如何重构产品知识能力与医疗场景落地路径

会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 居斌(浙江数字医疗卫生技术研究院副院长,浙江大学人工智能博士,20+ 年医疗与医药软件开发经验) | 时间: 2026-04-24 下午 · AI 重塑 ToB 产业应用分会场

一句话总结

医疗 AI 产品要走出 RAG”翻书模式”的瓶颈(语义鸿沟、知识库不一致、多轮对话失忆),必须把领域知识结构化、参数化、模块化封装为「知识胶囊」(Knowledge Capsules / KVI 框架),让知识直接进入模型 Attention 计算成为”肌肉记忆”,并以高频高价值科室为切入点构建胶囊市场,未来 AI 医疗的护城河不在模型大,而在「胶囊深、胶囊快、胶囊可组合」。

速览

  1. 产品三大范式同时切换——交互范式(你点我做 → 你说我做)/ 能力范式(确定性输出 → 生成式智能)/ 开发范式(编写逻辑 → 编排智能)。
  2. PM 职能跃迁:从流程编排到心智内化——AI Native PM 管理的是「模型心智」,核心资产从结构化数据变为非结构化行业知识 + 概率性推理能力 + 垂直领域权重。
  3. 中国医疗 AI 的不可能三角——高质量(Clinical Grade)+ 低成本(ROI Positive)+ 高可及(Scaling),传统 SFT 与 RAG 都解不开,必须找新范式。
  4. 两个标杆案例的两条路径——蚂蚁阿福(To-C 中国大众健康,3,000 万+ 月活)vs OpenEvidence(To-D 全球医生循证决策,76 万+ 注册医生 / 美国 40%+ 执业医师 / 估值 120 亿美元)。
  5. 从两个标杆得出 4 个结构性启示——用户分层决定一切 / 数据合规是护城河 / 商业模式取决于支付方 / 架构趋势从 RAG 向深度融合演进。
  6. RAG 范式的 3 个瓶颈——患者「家常话」vs 知识库「学术词」(语义鸿沟)/ 同一疾病多个「标准答案」(知识库不一致)/ 多轮对话「记不住」(无短期记忆)。
  7. 知识胶囊核心思想:从”翻书”到”肌肉记忆”——把知识压缩为 attention-compatible 的 Key-Value 单元,直接参与模型推理;像 App 一样按需加载 + 热替换,无需重训。
  8. KVI 三步框架——结构化抽取 → 胶囊化压缩 → External KVI 注入;论文实验中 KVI 在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG。
  9. 医疗胶囊市场启动:高频高价值科室切入 + 共建 + 市场化运营——从循证指南、药物相互作用、医保规则、科室亚专业、口语-术语映射等胶囊起步。
  10. 三层竞争力模型——基础层(通用 LLM 同质化)/ 中间层(知识资产胶囊库 = 真正护城河)/ 应用层(场景理解与交互 = PM 主战场)。

核心内容

Module 1:大模型驱动产品范式变革

范式转移:从「你点我做」到「你说我做」——交互的核心从”操作路径设计”转向”意图识别与执行”:

  • 传统 GUI · 指令驱动:层层递进(插入 → 图表 → 柱状图 → 选择数据 → 调整颜色)/ 机械操作(手动筛选、排序、编写复杂公式);
  • 大模型驱动 · 意图理解:自然语言(“帮我做一个过去三个月的销售柱状图,按产品分类”)/ 智能执行(“找出上季度复购率最高的前 10 个客户”)。

能力范式:从「确定性输出」到「生成式智能」——产品的能力边界从”预设功能”扩展为”动态推理与创造”:

对比维度规则执行(旧)认知生成(新)
逻辑基础固定代码/确定性规则概率分布 + 上下文语义
典型场景计算器、表单验证文案生成、代码辅助
  • 旧能力:存储与计算——输入 A 必得 B,逻辑精确但僵化,只能处理预先定义好的场景,无法应对未知变化;
  • 新能力:理解与生成——模型基于海量数据和上下文进行推理,输出结果具有创造性、灵活性和强适应性;
  • 产品设计逻辑转变——从”提供功能列表”转向”完成用户目标”;从”用户自行判断”转向”系统辅助决策”;
  • 风险提示——新能力伴随幻觉、偏见、安全边界模糊等风险,需通过引入专业知识库、人工复核确认、严格权限控制等机制来规避。

开发范式:从「编写逻辑」到「编排智能」——产品研发的核心工作从写 if-else 代码,转向设计提示词、评估模型输出和编排智能体(Agent):

  • 传统开发(Code-First):流程为需求分析 → 编写代码 → 测试验证 → 版本发布。痛点:逻辑固化在代码中,业务变更需修改代码并重新发版,迭代周期长;
  • 模型驱动开发(Model-Driven):流程为需求定义 → 设计提示词 → 编排工具 → 评估输出 → 迭代上下文。优势:逻辑在提示词与上下文中,变更即改即用,支持业务逻辑的实时敏捷迭代。

PM 职能跃迁:从「流程编排」到「心智内化」——过去的 PM 在管理「用户路径」,AI 时代的 PM 在管理「模型心智」:

维度过去 · 信息化 PM现在 · AI Native PM
核心资产结构化数据、确定性业务逻辑、UI/UX 规范非结构化行业知识、概率性推理能力、垂直领域权重
核心职能需求定义、原型绘制、功能验收、进度管理(“业务流程的数字化翻译”)知识图谱定义、SFT 数据治理、RLHF 偏好设定、模型能力评估(“通用智能的垂直领域塑造者”)
产品力护城河网络效应、用户迁移成本、极致交互体验私有知识的参数化密度、决策确定性、知识更新的 ROI

从「翻译流程」到「塑造智能」——这是产品经理职能的根本性跃迁。

小结:软件产品从「工具」到「交付者」的跃迁

  1. 规模产生质变——参数突破千亿后,涌现出理解、推理、上下文学习等非预设能力,实现质的飞跃;
  2. 从指令到意图——用户不再需要学习复杂的软件语法,模型能直接理解自然语言背后的真实业务目标;
  3. 从固定到生成——输出不再局限于预设的选项列表,而是基于输入动态创造全新的文本、代码或图像内容。

PPT 引用了钉钉 CEO 无招的观点:“软件已经进入”日抛""。

Module 2:医疗 AI 应用现状与挑战

中国医疗 AI 的「生死命题」:挑战不可能三角

三座大山:

  • 强监管——容错率几乎为零,要求模型具备「临床级确定性」;
  • 公立三甲主导——顶级专家资源垄断,优质服务难以下沉;
  • 医保单一支付——DRG/DIP 改革下,非确定性效率提升难商业化。

破局点 · 技术维度:

  • ❌ 传统微调 SFT:成本高、易遗忘;
  • ❌ RAG 外挂检索:难以保证复杂临床逻辑严密性;
  • → 寻找新范式:低成本注入专家私有知识 + 模型内化保证高质量。

唯有通过「知识的低成本、高精度内化」,才能解开中国医疗生态的死结。

医疗 AI 的「标配」:RAG 成为临床知识外挂「大脑」——准确性与实时性高要求下,RAG 凭借外部知识库调用能力成为大模型落地医疗的首选架构:

应用名称描述
CDSS临床决策支持文献类 / 监控类产品都属于 CDSS,有效缓解 LLM 在专业场景下的「幻觉」问题,提供可溯源的辅助建议
Patient Edu智能化患者教育用通俗易懂的语言回答患者关于疾病成因、检查流程、康复方案的疑问,提升沟通效率
EMR Auto结构化病历生成基于主诉、病史、检验结果,自动生成符合规范的诊疗建议初稿,释放医生文书压力

RAG 工作范式:提问 → 向量检索 → 拼接上下文 → LLM 生成 → 带引用的答案。

Module 3:主流 AI 医疗产品分析

医疗 AI 案例解构:蚂蚁阿福 × OpenEvidence——一个深耕中国 C 端「大众健康」,一个锁定全球 D 端「循证决策」,两种完全不同的技术-业务对齐路径。

蚂蚁阿福(To-C · China · Health Companion):

  • 3,000 万+ 月活用户(2026 年 1 月);
  • 5,000+ 合作医院接入挂号、医保、咨询闭环;
  • 目标用户:面向 C 端大众消费者,尤其强调三线及以下城市用户、老年人、家庭用户,以及优质医疗资源相对匮乏的下沉市场人群;挂号就医/医保缴费/健康咨询/健康管理场景打通,形成就医和健康管理服务闭环;
  • 目标用户三类:① 慢病长者(高血压/糖尿病/慢阻肺;用药查询、复诊提醒、家属代管);② 年轻家庭(儿童发热、亚健康咨询、体检解读、健康档案);③ 医保/就医用户(通过支付宝流量入口完成挂号-就医-支付-报销-诊后管理的全程就医实时路径及实时服务);
  • 核心产品能力:① 健康咨询(多模态提问、AI 诊室主动追问、医学报告解读、皮肤病识别);② 就医服务(线上链接 30 万真人医生、500+ 名医分身;线下智能生成全程就医时路径、语音交互申请医生一站式智慧服务;支付打通医保直付和商保直赔);③ 健康陪伴(家庭健康档案 = 父母/子女健康管理;智能穿戴设备接入);④ 健康管理(用药提醒、健康目标追踪、AI 教练);
  • AI 核心技术:专业垂类大模型(多模态:千亿级参数视觉语言识别,与迪安诊断等机构共建 AI 报告生成系统;专业性:依托浙江国家医疗人工智能基地提供模型支持,训练语料超万亿,专注于不同临床子专科的专有 AI 模型,并接入中华医学会杂志等知识库;安全性:隐私安全 = 医疗可信云、密态计算数据可用不可见,算力支持 = 医疗可信、一体机训推一体、国产算力软硬件加速;主动对话 Agent:更懂用户,通过”主动追问”功能实现多轮对话提升回答精准性);
  • 蚂蚁模型基础能力三件套:算力(万卡集群)+ 安全力(蚁天鉴一大模型安全一体化解决方案)+ 知识力(千亿级训练语料);
  • AI 核心技术总结:主动追问对话 Agent + 多模态(图文、语音、视频)+ 知识图谱+万亿级训练语料;
  • 【潜在】商业模式:目前处于用户规模扩张阶段,暂未明确盈利模式,明确无广告和商业排名。
    • 医药服务(C):结合好大夫医生生态和阿里医药生态,实现用户从咨询到就医、购药、管理服务的付费转化;
    • 会员订阅(C):蚂蚁阿福通过”AI 陪伴”模式将传统低频就医场景转化为高频健康管理需求,实现从咨询、就医、购药到理疗的一站式会员服务;
    • 健康险导流(医+药+险闭环)(B):依托支付宝生态,打通”医保直付+商保直赔”金融服务,构建从健康咨询 > 购药 > 理疗的全链路数字化闭环;
    • 核心逻辑:以流量免费起量 → 健康档案沉淀 → 医药 + 会员 + B 端三层变现。

OpenEvidence(To-Doctor · Global · Clinical Copilot):

  • 76 万+ 注册医生(约 40%+ 全美执业医师已使用);
  • 市值 120 亿美元
  • 专注 B 端/专业端,服务对象为经过身份验证的执业医生、护士及医疗专业人员,覆盖全美超 10,000 家医院和医疗中心;为医生提供具备「证据链」的决策支持,突破模型预训练记忆的时效性与准确性限制;
  • 目标用户三类(全球 D 端医生 · NPI 实名 · 仅限专业人士):① 一线临床医生(需要快速查询最新指南、RCT 证据;为床旁决策服务);② 住院医/医学生(替代碎片化 UpToDate / PubMed 查询,学习式问答);③ 专科医生与研究者(疑难病多跳推理;深度综述 DeepConsult 代替文献综述);
  • 准入门槛:NPI 号码 / 医师执照验证 · 确保每一位用户都是「持证专业人士」;
  • 核心产品能力:① 循证问答(每条结论附 PubMed 级引用,可一键跳转原文);② DeepConsult Agent(多研究文献深度推理,AI 智能体专为临床决策设计,免费向认证医生开放);③ 证据实时更新(指南 / RCT 每日入库,检索 3500 万篇同行评审论文,5-10 秒内返回带引用的循证答案);④ 工作流集成(与 EMR、UpToDate 并行,不打断诊疗节奏);
  • AI 核心技术:多模型融合 + 实时神经检索 + Agentic DeepConsult
内容
用户层医生自然语言问诊 · 临床上下文填充
Agent 层DeepConsult 多步规划 + 执行 + 验证
模型层GPT / Claude / Gemini 融合调度 + 医学微调
知识层35,000+ 期刊 · 实时向量检索 + 结构化引用

★ 关键差异化:把「引用链」当作一等公民,生成即带证据,天然抗幻觉。

  • 商业模式:医生免费 + 药企/医疗器械付费广告
模式内容数据
① Pharma Ads药企上下文精准投放:CPM $70-$1,000+,远高于一般数字广告> $100M ARR(2025)
② Sponsored Content疾病教育、指南解读的品牌内容合作,与循证问答场景原生融合$150M+ ARR(2026 E)
③ Enterprise医院/保险机构/药厂 API 授权;临床试验招募与市场研究$12B 最新估值

核心逻辑:把「医生注意力」变成最稀缺的广告资产——零订阅 → 规模 → 高 CPM。

从两个标杆看整个 AI 医疗行业:四个结构性启示

维度蚂蚁阿福(To-C)OpenEvidence(To-D)
目标用户中国 C 端大众全球 D 端医生
核心能力陪伴式健康管家 · 就医闭环循证决策 Copilot · 证据链
AI 技术Multi-Agent + Prompt Fence多模型融合 + 实时神经检索
商业模式医药 + 会员 + B 端(C+B 双轮)药企广告 + 企业授权(D 端免费)

四个结构性启示:

  1. 用户分层决定一切——C 端要「陪伴感 + 合规围栏」,D 端要「证据链 + 专业深度」;没有「通吃」的医疗 AI;
  2. 数据合规是护城河——NPI 验证、围栏提示、引用溯源——合规不是约束,而是 AI 医疗赢得信任的产品形态;
  3. 商业模式取决于支付方——C 端依赖「流量生态 + 会员」;D 端依赖「药企营销预算」——谁为知识付费,决定产品形态;
  4. 架构趋势:从 RAG 向深度融合演进——两家都在突破「拼接式 RAG」:或用 Multi-Agent 编排,或用 Agentic DeepConsult——方向都指向「知识与模型融合」。

Module 4:「知识外挂」RAG 范式的瓶颈

瓶颈一:患者的「家常话」 vs 知识库的「学术词」

核心痛点:患者描述症状时使用生活化口语,而医学知识库存储的是高度标准化的专业术语,导致向量检索无法在语义空间中有效对齐。

举例:

  • 患者口语化表达:“这两天总觉得胸口闷闷的,像压了块大石头一样,活动量大一点就有点喘不上气…”;
  • 医学知识库标准术语:胸闷、胸骨后压榨感、劳力性心绞痛、呼吸困难、心肌缺血体征……
  • RAG 检索失效结果:因无法将”压了块石头”映射到”压榨感”,向量召回片段缺失或相关性极低,无法辅助诊断。

语义鸿沟产生的根本原因:① 口语与医学本体存在天然语义断层;② 通用向量模型对医学长尾口语理解不足;③ 知识库缺乏显式的”口语-术语”映射层。

瓶颈二:同一疾病,多个「标准答案」

核心洞察:知识库的”不一致性”——医学知识库中充斥着版本差异、科室用药偏好、专家共识分歧,传统 RAG 无法有效处理这些逻辑冲突,导致回答失效。

举例:

  • 医生提问:65 岁高血压合并糖尿病,首选降压药?
  • 知识库召回:指南推荐 ACEI/ARB,专家共识推荐 CCB,说明书提示 ACEI 禁忌;
  • ❌ RAG 结果:输出”视患者具体情况而定”,无法给出明确的用药建议。

冲突来源三类:① 专家经验(临床指南有模棱两可地方,对同一病症的专家经验有习惯差异);② 生活质量需求(需长期治疗者,口服方案更具优势);③ 经济因素(官方指南、治疗方案与患者经济承担能力之间的博弈)。

瓶颈三:RAG「记不住」多轮对话中的动态信息

核心痛点:“失忆”的检索机制——RAG 每次检索都是”重新开始”,无法有效利用同一患者在多轮问诊中持续产生的上下文信息。

场景还原:糖尿病患者连续 4 周问诊:

  • 行为:每次提问都重新检索静态知识库,前三周的动态信息被”遗忘”;
  • 结果:模型不知患者已自行减药,只能机械回答”请遵医嘱”,无针对性。

机制缺陷:

  • 无”短期记忆”能力——每轮检索相互独立,无法建立会话内的信息关联;
  • 数据壁垒:动态信息难入静态库——病程变化是动态的,无法实时同步到静态的知识库中。

PPT 引用 HippoRAG 2: From RAG to Memory(公众号 agiled)作为业界对此问题的探索。

Module 5:「知识胶囊」:让知识进入模型计算核心

什么是「知识胶囊」:从「翻书」到「肌肉记忆」

将领域知识结构化、参数化、模块化地封装,使其直接参与模型 Attention 计算。

维度RAG · 知识外挂(翻书模式)知识内化(肌肉记忆模式)
形象类比大脑 → 外部知识库大脑内部存储(Brain 内含 KV 单元)
工作机制知识作为「文本 Tokens」拼入上下文,在 Attention 中与其他 Tokens 竞争;间接、不稳定,尤其在长上下文和多跳推理时失效知识被压缩为 Attention 可计算的 Key-Value 单元,直接参与模型推理;像「肌肉记忆」一样即插即用,冻结底座无需重训

三个核心机制

  • 结构化封装——从语料中抽取归一化的关系型知识单元;
  • 参数化注入——编码为 attention-compatible 的 Key-Value;
  • 可插拔组合——按需加载 + 热替换,知识像 App 一样管理。

技术原理:KVI 框架——让知识直接参与 Attention 计算

把胶囊编译进模型的注意力机制。论文:Knowledge Capsules: Structured Nonparametric Memory Units for LLMs(Bin Ju, Shenheng Weng, Danying Zhou, Kunkai Su;浙江大学 / MiniMax / 中新中以联合实验室)。

KVI(Knowledge Vector Injection)三步骤:

  1. STEP 1 结构化抽取——从指南、文献、病例中抽取归一化的 relational knowledge units(冻结底座模型完成);
  2. STEP 2 胶囊化压缩——将知识单元编译为 attention-compatible 的 Key-Value 表征,封装成可管理、可版本化的胶囊;
  3. STEP 3 External KVI 注入——推理时按需加载胶囊,Key-Value 直接参与 Attention 计算——知识级集成替代上下文级拼接。

代码地址:https://github.com/jubin76/KVI

能力对比:知识胶囊 vs RAG——RAG 解决「AI 不知道」;知识胶囊解决「AI 不会用」。

对比维度RAG · 知识外挂Knowledge Capsule · 知识内化
知识形态文本片段 Tokens参数化 Key-Value 模块
推理深度拼接式,长上下文易丢失融合式,直接进入 Attention 计算
多跳与长上下文稳定性弱,易幻觉稳定性与准确性显著提升
更新方式重建向量索引替换 / 热插拔胶囊
成本结构Token + 向量库 + 重排一次编译,多次调用,无需微调
可组合性弱,检索片段难组合强,胶囊可叠加、按场景编排

在论文实验中,KVI 范式在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG,且无需参数更新。

医疗场景落地:从「单胶囊」到「胶囊市场」

以高频高价值科室切入,共建 + 市场化运营,形成可持续的知识资产体系。

医疗知识胶囊库示例

  • 循证指南胶囊:心内、肿瘤、内分泌……;
  • 药物相互作用胶囊:DDI + 禁忌识别;
  • 医保规则胶囊:DRG/DIP + 控费;
  • 科室亚专业胶囊:房颤 / 糖尿病 / AKI;
  • 口语-术语映射胶囊:解决语义鸿沟。

三步走策略

  1. 切入:高频高价值科室——选择心内、肿瘤、内分泌等,高循证依赖 + 高错误代价 + 明确付费方;
  2. 共建:与医院 / 学会协作——和三甲专家共建胶囊内容,解决数据壁垒与专业深度,胶囊 IP 归属与分润清晰;
  3. 市场化:胶囊市场 + 平台生态——开放胶囊标准,第三方可贡献专业胶囊;平台抽佣 + 医院订阅,形成正反馈。

Module 6:未来 AI 医疗产品的核心竞争力

三层竞争力模型 & 给 PM 的三条行动建议

产品经理的战场:从「功能差异化」升级到「知识资产差异化」。

应用层
场景理解与交互 · PM 主战场
─────────────────────────
中间层 · 知识资产胶囊库 ★ 真正的护城河
私有知识参数化密度 · 决策确定性 · 更新 ROI
─────────────────────────
基础层
通用 LLM 模型能力 · 正在同质化

未来 AI 医疗产品的竞争不在「谁的模型大」,而在「谁的胶囊深、胶囊快、胶囊可组合」。

给 PM 的三条行动建议

  1. 知识即产品——把「领域知识的结构化 + 胶囊化」写进产品路线图,与功能需求同等优先级;
  2. 领域即壁垒——深耕一个场景,胜过浅做十个——胶囊深度正比于垂直深度;
  3. 胶囊即资产——建立胶囊的版本管理、评估体系、商业模式——像代码资产一样经营知识。

关键金句

「未来 AI 医疗产品的竞争不在『谁的模型大』,而在『谁的胶囊深、胶囊快、胶囊可组合』。」——居斌

「过去的 PM 在管理『用户路径』,AI 时代的 PM 在管理『模型心智』。」——居斌

「RAG 解决『AI 不知道』;知识胶囊解决『AI 不会用』。」——居斌

「合规不是约束,而是 AI 医疗赢得信任的产品形态。」——居斌(结构性启示二)

「软件已经进入”日抛”。」——无招(钉钉 CEO,被 PPT 引用)

可行建议

  • 把”领域知识的结构化 + 胶囊化”列入产品路线图,和功能需求同优先级;
  • 深耕一个高频高价值场景(心内/肿瘤/内分泌等),不要浅做十个;
  • 建立胶囊的版本管理、评估体系、商业模式——把知识当代码资产经营;
  • 做医疗 AI 必须先回答:用户分层(C 端要陪伴/合规围栏,D 端要证据链/专业深度)、合规链路(NPI 验证/围栏提示/引用溯源)、支付方画像(流量+会员 vs 药企营销预算);
  • 突破 RAG 三大瓶颈的工程化思路:
    • 解决语义鸿沟:建口语-术语映射胶囊;
    • 解决知识库不一致:用胶囊带版本号 + 优先级调度;
    • 解决多轮失忆:引入 HippoRAG 类的”短期记忆”机制 + 患者会话内动态胶囊;
  • KVI 论文 & 代码:Knowledge Capsules: Structured Nonparametric Memory Units for LLMs,https://github.com/jubin76/KVI

关键数据/案例索引

核心产品/品牌

  • 蚂蚁阿福(支付宝旗下医疗 AI 助手)
  • OpenEvidence(美国医生循证决策 Copilot)
  • 浙江数字医疗卫生技术研究院
  • 浙江国家医疗人工智能基地
  • 蚁天鉴(蚂蚁大模型安全一体化解决方案)
  • 钉钉(无招引用)
  • HippoRAG 2: From RAG to Memory(公众号 agiled)
  • 迪安诊断(蚂蚁阿福 AI 报告生成系统合作方)
  • 中华医学会杂志社、好大夫医生生态、阿里医药生态

关键数字

  • 蚂蚁阿福 3,000 万+ 月活(2026 年 1 月)、5,000+ 合作医院、30 万真人医生、500+ 名医分身
  • OpenEvidence 76 万+ 注册医生、约 40%+ 全美执业医师、覆盖全美超 10,000 家医院、市值 120 亿美元、35,000+ 期刊、检索 3,500 万篇论文、5-10 秒返回带引用循证答案
  • OpenEvidence 商业:Pharma Ads CPM $70-$1,000+、>$100M ARR (2025)、Sponsored Content $150M+ ARR (2026 E)、Enterprise $12B 估值
  • 蚂蚁阿福训练语料 > 万亿、参数千亿级
  • KVI 论文实验:在多项 QA 基准(含长上下文、多跳)上持续优于 RAG 与 GraphRAG,无需参数更新

核心技术名词

  • KVI(Knowledge Vector Injection)框架
  • Knowledge Capsules(知识胶囊)
  • Key-Value 注入、Attention 计算
  • RAG(Retrieval Augmented Generation)
  • GraphRAG
  • Multi-Agent + Prompt Fence
  • Agentic DeepConsult
  • 实时神经检索
  • HippoRAG 2
  • CDSS(临床决策支持)
  • EMR(电子病历)
  • DDI(药物相互作用)
  • DRG/DIP(医保支付改革)
  • NPI(美国国家医疗服务提供者识别号)
  • SFT(Supervised Fine-Tuning)
  • RLHF(基于人类反馈的强化学习)

模型供应商:GPT、Claude、Gemini(OpenEvidence 多模型融合);蚂蚁专业垂类大模型(千亿级参数)

论文/代码

  • Knowledge Capsules: Structured Nonparametric Memory Units for LLMs(作者:Bin Ju、Shenheng Weng、Danying Zhou、Kunkai Su;机构:浙江大学 / MiniMax / 中新中以联合实验室)
  • 代码:https://github.com/jubin76/KVI

讲者背景

  • 浙江大学人工智能博士、高级工程师
  • 中华医学会数字医学分会委员
  • 浙江省人工智能发展专家委员会医疗健康大数据专项小组成员
  • 浙江省卫生信息协会医疗大数据与人工智能专委会委员
  • 20+ 年医疗与医药软件开发经验
  • 浙江省政府科学技术进步一等奖 1 项 / 二等奖 1 项
  • 发表 21 篇 SCI、3 篇 EI,授权发明专利 10 项

胶囊库示例:循证指南 / 药物相互作用 / 医保规则 / 科室亚专业 / 口语-术语映射

5 阶段进化路径(无明确 L1-L5 定义,PPT 主要按”瓶颈 → 解法”组织,省略阶段化总结)

三层竞争力模型:基础层(通用 LLM)/ 中间层(知识资产胶囊库 = 护城河)/ 应用层(场景理解与交互 = PM 主战场)