MiniMax on OpenClaw:Agent 产品设计的实战方法论
会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 冯雯(MiniMax 开放平台产品负责人) | 时间: 2026-04-24 下午 · AI Agent 设计与商业化分会场
一句话总结
MiniMax 在做 Agent 产品时,把”用户认知边界、信任阶梯、失败预期”作为前置设计逻辑,再叠加多端一致性 + 反馈产品化的迭代闭环,并通过拥抱 OpenClaw 开源生态(MaxClaw / MaxHermes / Office Skills)和 M2 模型 + Planner-Executor-Memory-Tools 四件套架构,把”让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管”的能力跨越落到了一款上线一个月迭代 12 次的 MiniMax Agent 上。
速览
- 重构设计逻辑三件套——AI Agent 产品先解决「边界感知 / 信任阶梯 / 失败预期」三个底层问题,再谈功能。
- 信任阶梯 4 级——让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管,每跨一级都是用户心理门槛的产品化跨越。
- 首次体验=产品生死线——首个任务必须小而完整、5 分钟可完成、成功率高、结果可感知,MiniMax 选「帮我整理这份文件」作引导任务。
- 失败要透明而非掩盖——保留中间成果支持断点续做、允许用户介入修正后继续,是 Agent 失败兜底的正确姿势。
- 多端策略:功能一致 + 交互适配——IM 插件做轻量对话、桌面端做完整功能与本地集成、Web 端做即开即用,统一能力但适配各端形态。
- 反馈产品化四步闭环——把”不对、重来、主动修改”等自然语言反馈,自动分类→量化→驱动迭代,形成持续优化循环。
- MiniMax Agent V1 → V2 一个月 12 次迭代——支持复杂全栈付费网站(注册登录、订单管理、LLM 调用、定时任务)、Excel 转化数据看板、定制资讯推送等场景。
- 拥抱 OpenClaw 开源生态:MaxClaw + MaxHermes + Office Skills——MaxClaw 是 MiniMax + OpenClaw 的桌面端安全沙箱;MaxHermes 是自我进化、24/7 在线、嵌入日常应用的 Agent;Office Skills 开源了 Word / Excel / PPT / PDF 的生产级文档引擎。
- 架构选型:Single-Agent 路线——Anthropic、Cognition、LangChain 三家研究均显示单 Agent 在小任务/工具变多时整体表现最优,多 Agent Swarm 仅在工具/信息量极大时占优。
- M2 系列模型 + Planner-Executor-Memory-Tools 四件套——M2 在 SWE-bench Verified 上稳步攀升,Notion / OpenClaw 创始人公开背书;Memory 引入 Session Note + 历史摘要机制 + 100 万 token 上下文 + KV-Cache 优化。
核心内容
重构设计逻辑:边界感知 · 信任阶梯 · 失败预期
冯雯在 PART 1 用三个关键词重构了 Agent 产品设计的底层逻辑——这三件事必须先于具体功能解决。
边界感知——核心问题是用户根本不知道 AI 能做什么、不能做什么。设计挑战在于「如何通过设计让能力边界可触摸」,给出 4 个产品化手段:
- 能力外显化——主动展示 AI 可完成的任务类型;
- 引导式探索——通过示例和模板降低认知门槛;
- 渐进式披露——根据使用深度逐步展示高级功能;
- 清晰的反馈——当达到能力边界时给出明确提示。
信任阶梯——把”用户从让 AI 看到让 AI 做”的心理门槛拆为 4 级:
| Level | 能力 | 含义 |
|---|---|---|
| Level 1 | 让 AI 看 | 用户展示信息,AI 只做分析建议 |
| Level 2 | 让 AI 帮 | AI 辅助执行,用户确认每一步 |
| Level 3 | 让 AI 做 | AI 自主完成任务,用户只需审核结果 |
| Level 4 | 让 AI 管 | AI 持续自动化运行,用户设定规则即可 |
每跨一级,都是产品设计要主动做的工作,不是用户自然进化的结果。
失败预期——Agent 必然会犯错,关键是设计让用户「接受失败」而非「放弃产品」的体验兜底。错误做法是隐藏错误、给模糊提示、让用户从头重来;正确做法是透明展示任务进度和状态、提供清晰的错误原因和解决建议、保留中间成果支持断点续做、允许用户介入修正后继续。
首次体验设计:用户第一个任务应该是什么
PPT 直接给出 4 条原则:
- 任务要小而完整——5 分钟内可完成,但能展示完整能力闭环;
- 成功率要高——首次体验失败是用户流失的主要原因;
- 结果要可感知——用户能清晰看到 AI 完成了什么;
- 引导要自然——通过示例而非教程,通过模板而非说明。
MiniMax 的实践案例:选择「帮我整理这份文件」作为引导任务——它符合所有 4 条原则。
多端体验一致性:功能一致、交互适配
策略是「功能一致、交互适配」——能力维度统一,呈现形态各端差异化:
| 端 | 核心定位 | 交互适配 |
|---|---|---|
| 消息平台(IM 插件) | 快速对话、轻量任务 | 跨设备、卡片式回复、快捷指令 |
| Desktop App(桌面端) | 完整功能、本地集成 | 文件系统访问、后台运行 |
| Web(网页端) | 即开即用 | 响应式布局、云端同步 |
反馈产品化:把自然语言反馈转化为可量化迭代输入
四步闭环:
- 采集——捕获用户在对话中的「不对、重来、主动修改」等自然语言反馈;
- 分类——自动识别反馈类型(能力缺失 / 理解错误 / 体验问题);
- 量化——转化为可追踪指标(任务成功率 / 满意度 / 重试率);
- 迭代——驱动产品和模型优化。
迭代结果重新进入采集阶段,形成持续优化循环。
MiniMax Agent V1 → V2:一个月 12 次迭代
V1 能力盘点(PPT 用一张「卢浮宫之旅」的虚拟博物馆案例展示):
- 编程能力——各种网站、游戏开发交付质量高,运行稳定;
- 多模态理解——多模态输入理解和多模态输出;
- 深度研究 DeepResearch——内置大量工具,更多信息源,记忆灵活;
- MCP 生态支持——内置常用 MCP 工具,支持自定义;
- PPT——多种可视化展示形态,非套模板。
V2 升级(上线一个月完成 12 次功能更新):
- 高复杂度全栈网站应用——支持注册登录、实时数据、下单支付、订单管理、LLM 调用、定时任务等;
- Excel 转化成数据看板——支持定制数据看板、Excel 复杂数据分析、生成 CRM/SaaS 小工具等场景;
- 定制资讯推送——定制个人订阅网站,用户可设定订阅任务,通过 AI research 能力获取信息推送,还能自主设定推送频率和任意 UI。
桌面端——MiniMax Agent 提供 Mac (ARM/x64) / Windows / iOS / Android 全平台版本,强调两个能力:
- 本地文件处理——直接读取、写入、整理和分析授权目录下的文件,实现批量处理、格式转换、智能归档;
- 浏览器接管——Agent 可以像”人”一样操作浏览器,完成真实的点击、填写、提交,而不仅仅是查信息。
拥抱 OpenClaw 开源生态:MaxClaw / MaxHermes / Office Skills
Skillhub 平台——MiniMax Agent 正式上线 Skillhub,精选上百种 Skills 供探索、安装。PPT 展示了 html-presentation-generator、industry-research-report、hot-topic-tracker、minimax-docx、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、minimax-xlsx、pptx-generator、investment-research-analyst、knowledge-digest、prd-to-prototype 等 Skill。Skill 可在微信中调试或在 MaxClaw 中调试。
MaxClaw = MiniMax + OpenClaw——MiniMax Agent 桌面端部署安全版 OpenClaw,定位「龙虾医生随时诊断修复」:
- 龙虾医生随时在线,会预置安全诊断 Skill,减少 OpenClaw 高危操作风险,并根据 OpenClaw 报错提示自主诊断修复;
- MaxClaw 沙箱服务升级,稳定性全面优化;
- 新环境支持 root 权限,用户可自由安装依赖库与浏览器,也可在 OpenClaw 框架更新时自行升级,灵活性拉满。
PPT 同时展示了 OpenClaw 在云上规模化运行的挑战(Security 沙箱逃逸/侧信道、24/7 运行时要求、规模下成本控制、特性更新无须重启等)以及 MaxClaw Framework 的 Unified Scalable Architecture 架构图(包含 Public Access Layer、ML Layer、Storage Layer 等)。
MiniMax Office Skills——开源一套生产级办公文档引擎:
| Skill | 能力 | 技术栈 |
|---|---|---|
| MiniMax-docx | Word 文档创建、编辑、模板应用 | .NET OpenXML SDK + C# |
| MiniMax-xlsx | Excel 数据看板、加载、编辑、公式应用 | XML、直接生成 + Python |
| MiniMax-pdf | 可视化 PDF 生成、15 种封面设计模式 | ReportLab + Playwright |
| PPTX-generator | PPT 演示文稿创建与编辑 | PptxGenJS + XML |
MaxHermes = MiniMax Agent + Hermes——三个核心定位:
- Self-evolution:Each completion of a complex task unlocks a brand-new skill(每完成一个复杂任务就解锁一个新技能);
- Always on, zero wait:Live in 10 seconds, running 24/7 in the cloud(10 秒上线,云端 24/7 运行);
- Right where you need it:Accessible in your daily apps, with expanding support for more(可在日常应用中访问,支持范围持续扩大)。
Agent 架构设计:Single Agent vs Multi-Agent 的选择
冯雯引用 Anthropic、Cognition、LangChain 三家公司的研究(“How we built our multi-agent research system”、“Don’t Build Multi-Agents”、“Benchmarking Multi-Agent Architectures”)做出选型分析:
| 维度 | Single Agent | Multi-Agent (Supervisor) | Multi-Agent (Swarm/Team) |
|---|---|---|---|
| 架构描述 | 单一 Agent 拥有全部工具与指令,直接处理所有任务 | 主 Agent 接收任务 → 分派给 Sub Agent → 汇总结果 | 所有 Agent 对等,可互相 handoff,关注某一时刻由一个 Agent 活跃 |
| 适用场景 | 单一任务,工具数量少,路径简单 | 任务复杂,需要分工与汇总 | 多元任务、工具繁杂且需要快速响应使用者 |
| 复杂任务表现 | 在任务/工具变多时效能迅速下滑 | 在高干扰、多任务中表现稳定,但需 Lead Agent 回传结果 | 在高干扰、多任务中表现最佳,可直接面向使用者回应 |
| 优点 | 简单直接,无需协调成本 | 结构化管理复杂任务,稳定性高 | 最具灵活度,对复杂 context 抗干扰能力强 |
| 缺点 | 对杂乱 context 抵抗力弱 | 需额外协调(Lead Agent 汇总) | Agent 之间切换复杂,但表现最佳 |
| 实验结论 | 小任务最强,大任务最弱 | 复杂任务中表现稳定 | 工具多、信息量大时整体表现最优 |
冯雯把 MiniMax Agent 的架构定位在 Single-Agent 路线,并配合下面四件套来弥补单 Agent 在复杂任务中的弱点。
MiniMax Agent 架构四件套
- Planner 规划器——任务解析、拆解与执行路径规划:将用户指令拆解为子任务、识别子任务间依赖关系、制定工具调用与推理的顺序、实现「交错思维链」机制;
- Executor 执行器——子任务执行与结果处理:按规划执行具体操作、协调多模态模型调用、处理条件分支与循环控制、整合并返回最终结果;
- Memory 记忆系统——上下文管理与长期记忆:维护超长上下文窗口、实现”闪电注意力机制”、支持 100 万 token 长序列处理、提供记忆检索与归纳能力;
- 工具注册——第三方工具接入与管理:支持 MCP 协议的 XML 工具描述、实现低代码甚至无代码接入、提供工具调用隔离与审计、构建丰富的应用生态系统。
架构优势:模块化设计组件可独立优化与替换;清晰的协作机制支持复杂任务流程;高效执行路径,实现「1.5 小时完成复杂任务」。
Agent 架构子模块细节
Executor 执行器工具集(PPT 完整列出,按主题归类):
- 消息类:message_notify_user(向用户发送消息无需回复)、message_ask_user(向用户提问待回复);
- 文件操作:file_read(读取文件内容)、file_write(写入或附加内容到文件)、file_str_replace(替换文件中的特定字符串)、file_find_in_content(在文件内容中搜索文本)、file_find_by_name(通过名称模式查找文件);
- Shell 操作:shell_exec(执行 shell 命令)、shell_view(查看 shell 会话内容)、shell_wait(等待运行进程完成)、shell_write_to_process(向运行中的进程发送输入)、shell_kill_process(终止运行中的进程);
- Browser 操作:browser_view、browser_navigate、URLbrowser_restart、browser_click、browser_input、browser_move_mouse、browser_press_key、browser_select_option、browser_scroll_up / scroll_down、browser_console_exec、JavaScriptbrowser_console_view;
- 网络/搜索:info_search_web(使用搜索引擎搜索网页)、deploy_expose_port(将本地端口暴露用于公共访问)、deploy_apply_deployment(部署网站/应用程序);
- 任务流转:make_manus_page(从 MDX 文件创建页面)、idle(指示任务完成)。
PPT 同时展示该 Executor 已用于 PDF 处理、基本任务、搜索三大场景。
Planner 规划器——专为 Agent 而生的全自研 MiniMax M2 系列模型:
- 出色规划并稳定执行复杂长链条工具调用任务,协同调用 Shell、Browser、Python 代码执行器和各种 MCP 工具;
- SWE-bench Verified Score Evolution 图表显示 MiniMax (M Series) 与 Anthropic (Sonnet/Opus)、OpenAI (GPT)、Google (Gemini) 的得分演进;M2 在 Feb 26 等节点已接近第一梯队水平;
- 第三方背书:OpenClaw 创始人 Peter Steinberger(@steipete)公开评价”MiniMax is the best alternative”、“I use @MiniMax_AI there as well so it’s quite alright”、“MiniMax is a good option as fallback. OpenAI works well but lacks… character.”;Notion CEO Ivan Zhao(@ivanhzhao)发推:“We added a new model to Custom Agents last night (MiniMax M2.5). Give us cost and performance feedback.”;Notion 模型选择菜单里出现了 MiniMax M2.5(Experimental Open Weight Models)选项。
Memory 记忆系统四要素:
- Session Note 工具——将”重要发现/中间结果/用户关键信息”等写入一个结构化或半结构化的记忆对象。记忆可以跨会话存在(重启任务或新的会话交互时仍然可用);
- 历史摘要机制——自动执行摘要操作,将旧历史压缩成”记忆摘要”或”核心事实”。维持【最新上下文】+【历史摘要】→ 保障连贯性 + 限制成本;
- 工具调用与记忆融合——记忆模块可以 Agent 执行过程中的工具使用结果、决策轨迹、关键里程碑。后续步骤、后续会话可以基于这些记忆做检索或引用,维持”状态感知”与”任务连续性”;
- 可配置的 Token 限制与工作流分割——允许用户设定 max_steps、工作区路径、模型、工具集合。遵从”当历史 Token > 某阈值时压缩成摘要”的上下文管理机制。
上下文管理 6 条工程实践(PPT 用 6 个对比图分别展示 ❌ 和 ✓ 两种做法):
- Design Around the KV-Cache——围绕 KV 缓存进行设计,减少 TTFT 和成本;
- Mask, Don’t Remove——在解码中掩蔽有关 token 的 logits,减少模型幻觉;
- Use the File System as Context——按需读取和写入,用作存储和结构化的外部记忆;
- Manipulate Attention Through Recitation——更新 Todo list,但始终将目标复述到上下文的末尾;
- Keep the Wrong Stuff In——将错误的尝试保留在上下文中(让模型从失败中学习);
- Don’t Get Few-Shotted——引入少量的结构化变化增加多样性,避免被 few-shot 套牢。
关键金句
「让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管,每跨一级都是用户心理门槛的产品化跨越。」——冯雯
「Agent 必然会犯错,关键是设计让用户『接受失败』而非『放弃产品』的体验兜底。」——冯雯
「Self-evolution. Each completion of a complex task unlocks a brand-new skill.」——MaxHermes 设计哲学
「首次体验失败是用户流失的主要原因;MiniMax 选『帮我整理这份文件』作为引导任务。」——冯雯
可行建议
- 做 Agent 产品先把「边界感知 / 信任阶梯 / 失败预期」三件事的设计落到具体页面/交互上,再做功能;
- 引导任务必须满足「5 分钟内完成 + 成功率高 + 结果可感知 + 自然引导」四条;
- 用户每一句”不对、重来”都是反馈金矿,建立采集 → 分类 → 量化 → 迭代的产品化闭环;
- 多端策略不是抹平差异,而是「功能一致、交互适配」;
- 选 Single-Agent 还是 Multi-Agent,按工具数量和任务复杂度决定,不要追潮流;
- Memory 模块要写:Session Note + 历史摘要 + 工具调用记忆融合 + Token 阈值压缩;
- 上下文工程上至少落实 6 件事:KV-Cache 设计 / Mask 而非 Remove / 文件系统当 Context / Recitation 维持注意力 / 保留错误 / 避免 few-shot 套牢。
关键数据/案例索引
产品/品牌名:
- MiniMax、MiniMax Agent(V1 / V2)、海螺 AI、MiniMaxAudio、星野、Talkie、开放平台
- MaxClaw(MiniMax + OpenClaw)、MaxHermes(MiniMax Agent + Hermes)、Skillhub
- MiniMax Office Skills:MiniMax-docx、MiniMax-xlsx、MiniMax-pdf、PPTX-generator
- 其他 Skill:html-presentation-generator、industry-research-report、hot-topic-tracker、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、investment-research-analyst、knowledge-digest、prd-to-prototype
模型:MiniMax M Series(M2 / M2.5)、Anthropic Sonnet/Opus、OpenAI GPT、Google Gemini
架构组件:Planner、Executor、Memory、工具注册(MCP 协议 XML 描述)
Memory 关键技术:Session Note、历史摘要、KV-Cache、闪电注意力机制、100 万 token 长上下文
第三方背书:Peter Steinberger(OpenClaw 创始人 @steipete)、Ivan Zhao(Notion CEO @ivanhzhao)
关键数字:
- MiniMax Agent V2 上线一个月完成 12 次功能更新
- 1.5 小时完成复杂任务
- 100 万 token 长序列处理
- 信任阶梯 4 级
- 首次体验任务限 5 分钟
架构论文/参考:Anthropic”How we built our multi-agent research system”、Cognition”Don’t Build Multi-Agents”、LangChain”Benchmarking Multi-Agent Architectures”、Multi-agent System Process Diagram
SWE-bench Verified Score Evolution:MiniMax M Series 在 Feb 25 → Feb 26 期间得分稳步上升,对标 Anthropic、OpenAI、Google 主力模型
OpenClaw 在云上挑战:Security(沙箱逃逸、侧信道、网络访问、数据泄漏)、Functionality(24/7 运行、root 权限、多租户数据共享)、Performance(冷启动慢、规模化资源效率)、Flexibility(无重启更新特性、用户独立升级 OpenClaw)