MiniMax on OpenClaw：Agent 产品设计的实战方法论

会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 冯雯（MiniMax 开放平台产品负责人） | 时间: 2026-04-24 下午 · AI Agent 设计与商业化分会场

一句话总结

MiniMax 在做 Agent 产品时，把”用户认知边界、信任阶梯、失败预期”作为前置设计逻辑，再叠加多端一致性 + 反馈产品化的迭代闭环，并通过拥抱 OpenClaw 开源生态（MaxClaw / MaxHermes / Office Skills）和 M2 模型 + Planner-Executor-Memory-Tools 四件套架构，把”让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管”的能力跨越落到了一款上线一个月迭代 12 次的 MiniMax Agent 上。

速览

重构设计逻辑三件套——AI Agent 产品先解决「边界感知 / 信任阶梯 / 失败预期」三个底层问题，再谈功能。
信任阶梯 4 级——让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管，每跨一级都是用户心理门槛的产品化跨越。
首次体验=产品生死线——首个任务必须小而完整、5 分钟可完成、成功率高、结果可感知，MiniMax 选「帮我整理这份文件」作引导任务。
失败要透明而非掩盖——保留中间成果支持断点续做、允许用户介入修正后继续，是 Agent 失败兜底的正确姿势。
多端策略：功能一致 + 交互适配——IM 插件做轻量对话、桌面端做完整功能与本地集成、Web 端做即开即用，统一能力但适配各端形态。
反馈产品化四步闭环——把”不对、重来、主动修改”等自然语言反馈，自动分类→量化→驱动迭代，形成持续优化循环。
MiniMax Agent V1 → V2 一个月 12 次迭代——支持复杂全栈付费网站（注册登录、订单管理、LLM 调用、定时任务）、Excel 转化数据看板、定制资讯推送等场景。
拥抱 OpenClaw 开源生态：MaxClaw + MaxHermes + Office Skills——MaxClaw 是 MiniMax + OpenClaw 的桌面端安全沙箱；MaxHermes 是自我进化、24/7 在线、嵌入日常应用的 Agent；Office Skills 开源了 Word / Excel / PPT / PDF 的生产级文档引擎。
架构选型：Single-Agent 路线——Anthropic、Cognition、LangChain 三家研究均显示单 Agent 在小任务/工具变多时整体表现最优，多 Agent Swarm 仅在工具/信息量极大时占优。
M2 系列模型 + Planner-Executor-Memory-Tools 四件套——M2 在 SWE-bench Verified 上稳步攀升，Notion / OpenClaw 创始人公开背书；Memory 引入 Session Note + 历史摘要机制 + 100 万 token 上下文 + KV-Cache 优化。

核心内容

重构设计逻辑：边界感知 · 信任阶梯 · 失败预期

冯雯在 PART 1 用三个关键词重构了 Agent 产品设计的底层逻辑——这三件事必须先于具体功能解决。

边界感知——核心问题是用户根本不知道 AI 能做什么、不能做什么。设计挑战在于「如何通过设计让能力边界可触摸」，给出 4 个产品化手段：

能力外显化——主动展示 AI 可完成的任务类型；
引导式探索——通过示例和模板降低认知门槛；
渐进式披露——根据使用深度逐步展示高级功能；
清晰的反馈——当达到能力边界时给出明确提示。

信任阶梯——把”用户从让 AI 看到让 AI 做”的心理门槛拆为 4 级：

Level	能力	含义
Level 1	让 AI 看	用户展示信息，AI 只做分析建议
Level 2	让 AI 帮	AI 辅助执行，用户确认每一步
Level 3	让 AI 做	AI 自主完成任务，用户只需审核结果
Level 4	让 AI 管	AI 持续自动化运行，用户设定规则即可

每跨一级，都是产品设计要主动做的工作，不是用户自然进化的结果。

失败预期——Agent 必然会犯错，关键是设计让用户「接受失败」而非「放弃产品」的体验兜底。错误做法是隐藏错误、给模糊提示、让用户从头重来；正确做法是透明展示任务进度和状态、提供清晰的错误原因和解决建议、保留中间成果支持断点续做、允许用户介入修正后继续。

首次体验设计：用户第一个任务应该是什么

PPT 直接给出 4 条原则：

任务要小而完整——5 分钟内可完成，但能展示完整能力闭环；
成功率要高——首次体验失败是用户流失的主要原因；
结果要可感知——用户能清晰看到 AI 完成了什么；
引导要自然——通过示例而非教程，通过模板而非说明。

MiniMax 的实践案例：选择「帮我整理这份文件」作为引导任务——它符合所有 4 条原则。

多端体验一致性：功能一致、交互适配

策略是「功能一致、交互适配」——能力维度统一，呈现形态各端差异化：

端	核心定位	交互适配
消息平台（IM 插件）	快速对话、轻量任务	跨设备、卡片式回复、快捷指令
Desktop App（桌面端）	完整功能、本地集成	文件系统访问、后台运行
Web（网页端）	即开即用	响应式布局、云端同步

反馈产品化：把自然语言反馈转化为可量化迭代输入

四步闭环：

采集——捕获用户在对话中的「不对、重来、主动修改」等自然语言反馈；
分类——自动识别反馈类型（能力缺失 / 理解错误 / 体验问题）；
量化——转化为可追踪指标（任务成功率 / 满意度 / 重试率）；
迭代——驱动产品和模型优化。

迭代结果重新进入采集阶段，形成持续优化循环。

MiniMax Agent V1 → V2：一个月 12 次迭代

V1 能力盘点（PPT 用一张「卢浮宫之旅」的虚拟博物馆案例展示）：

编程能力——各种网站、游戏开发交付质量高，运行稳定；
多模态理解——多模态输入理解和多模态输出；
深度研究 DeepResearch——内置大量工具，更多信息源，记忆灵活；
MCP 生态支持——内置常用 MCP 工具，支持自定义；
PPT——多种可视化展示形态，非套模板。

V2 升级（上线一个月完成 12 次功能更新）：

高复杂度全栈网站应用——支持注册登录、实时数据、下单支付、订单管理、LLM 调用、定时任务等；
Excel 转化成数据看板——支持定制数据看板、Excel 复杂数据分析、生成 CRM/SaaS 小工具等场景；
定制资讯推送——定制个人订阅网站，用户可设定订阅任务，通过 AI research 能力获取信息推送，还能自主设定推送频率和任意 UI。

桌面端——MiniMax Agent 提供 Mac (ARM/x64) / Windows / iOS / Android 全平台版本，强调两个能力：

本地文件处理——直接读取、写入、整理和分析授权目录下的文件，实现批量处理、格式转换、智能归档；
浏览器接管——Agent 可以像”人”一样操作浏览器，完成真实的点击、填写、提交，而不仅仅是查信息。

拥抱 OpenClaw 开源生态：MaxClaw / MaxHermes / Office Skills

Skillhub 平台——MiniMax Agent 正式上线 Skillhub，精选上百种 Skills 供探索、安装。PPT 展示了 html-presentation-generator、industry-research-report、hot-topic-tracker、minimax-docx、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、minimax-xlsx、pptx-generator、investment-research-analyst、knowledge-digest、prd-to-prototype 等 Skill。Skill 可在微信中调试或在 MaxClaw 中调试。

MaxClaw = MiniMax + OpenClaw——MiniMax Agent 桌面端部署安全版 OpenClaw，定位「龙虾医生随时诊断修复」：

龙虾医生随时在线，会预置安全诊断 Skill，减少 OpenClaw 高危操作风险，并根据 OpenClaw 报错提示自主诊断修复；
MaxClaw 沙箱服务升级，稳定性全面优化；
新环境支持 root 权限，用户可自由安装依赖库与浏览器，也可在 OpenClaw 框架更新时自行升级，灵活性拉满。

PPT 同时展示了 OpenClaw 在云上规模化运行的挑战（Security 沙箱逃逸/侧信道、24/7 运行时要求、规模下成本控制、特性更新无须重启等）以及 MaxClaw Framework 的 Unified Scalable Architecture 架构图（包含 Public Access Layer、ML Layer、Storage Layer 等）。

MiniMax Office Skills——开源一套生产级办公文档引擎：

Skill	能力	技术栈
MiniMax-docx	Word 文档创建、编辑、模板应用	.NET OpenXML SDK + C#
MiniMax-xlsx	Excel 数据看板、加载、编辑、公式应用	XML、直接生成 + Python
MiniMax-pdf	可视化 PDF 生成、15 种封面设计模式	ReportLab + Playwright
PPTX-generator	PPT 演示文稿创建与编辑	PptxGenJS + XML

MaxHermes = MiniMax Agent + Hermes——三个核心定位：

Self-evolution：Each completion of a complex task unlocks a brand-new skill（每完成一个复杂任务就解锁一个新技能）；
Always on, zero wait：Live in 10 seconds, running 24/7 in the cloud（10 秒上线，云端 24/7 运行）；
Right where you need it：Accessible in your daily apps, with expanding support for more（可在日常应用中访问，支持范围持续扩大）。

Agent 架构设计：Single Agent vs Multi-Agent 的选择

冯雯引用 Anthropic、Cognition、LangChain 三家公司的研究（“How we built our multi-agent research system”、“Don’t Build Multi-Agents”、“Benchmarking Multi-Agent Architectures”）做出选型分析：

维度	Single Agent	Multi-Agent (Supervisor)	Multi-Agent (Swarm/Team)
架构描述	单一 Agent 拥有全部工具与指令，直接处理所有任务	主 Agent 接收任务 → 分派给 Sub Agent → 汇总结果	所有 Agent 对等，可互相 handoff，关注某一时刻由一个 Agent 活跃
适用场景	单一任务，工具数量少，路径简单	任务复杂，需要分工与汇总	多元任务、工具繁杂且需要快速响应使用者
复杂任务表现	在任务/工具变多时效能迅速下滑	在高干扰、多任务中表现稳定，但需 Lead Agent 回传结果	在高干扰、多任务中表现最佳，可直接面向使用者回应
优点	简单直接，无需协调成本	结构化管理复杂任务，稳定性高	最具灵活度，对复杂 context 抗干扰能力强
缺点	对杂乱 context 抵抗力弱	需额外协调（Lead Agent 汇总）	Agent 之间切换复杂，但表现最佳
实验结论	小任务最强，大任务最弱	复杂任务中表现稳定	工具多、信息量大时整体表现最优

冯雯把 MiniMax Agent 的架构定位在 Single-Agent 路线，并配合下面四件套来弥补单 Agent 在复杂任务中的弱点。

MiniMax Agent 架构四件套

Planner 规划器——任务解析、拆解与执行路径规划：将用户指令拆解为子任务、识别子任务间依赖关系、制定工具调用与推理的顺序、实现「交错思维链」机制；
Executor 执行器——子任务执行与结果处理：按规划执行具体操作、协调多模态模型调用、处理条件分支与循环控制、整合并返回最终结果；
Memory 记忆系统——上下文管理与长期记忆：维护超长上下文窗口、实现”闪电注意力机制”、支持 100 万 token 长序列处理、提供记忆检索与归纳能力；
工具注册——第三方工具接入与管理：支持 MCP 协议的 XML 工具描述、实现低代码甚至无代码接入、提供工具调用隔离与审计、构建丰富的应用生态系统。

架构优势：模块化设计组件可独立优化与替换；清晰的协作机制支持复杂任务流程；高效执行路径，实现「1.5 小时完成复杂任务」。

Agent 架构子模块细节

Executor 执行器工具集（PPT 完整列出，按主题归类）：

消息类：message_notify_user（向用户发送消息无需回复）、message_ask_user（向用户提问待回复）；
文件操作：file_read（读取文件内容）、file_write（写入或附加内容到文件）、file_str_replace（替换文件中的特定字符串）、file_find_in_content（在文件内容中搜索文本）、file_find_by_name（通过名称模式查找文件）；
Shell 操作：shell_exec（执行 shell 命令）、shell_view（查看 shell 会话内容）、shell_wait（等待运行进程完成）、shell_write_to_process（向运行中的进程发送输入）、shell_kill_process（终止运行中的进程）；
Browser 操作：browser_view、browser_navigate、URLbrowser_restart、browser_click、browser_input、browser_move_mouse、browser_press_key、browser_select_option、browser_scroll_up / scroll_down、browser_console_exec、JavaScriptbrowser_console_view；
网络/搜索：info_search_web（使用搜索引擎搜索网页）、deploy_expose_port（将本地端口暴露用于公共访问）、deploy_apply_deployment（部署网站/应用程序）；
任务流转：make_manus_page（从 MDX 文件创建页面）、idle（指示任务完成）。

PPT 同时展示该 Executor 已用于 PDF 处理、基本任务、搜索三大场景。

Planner 规划器——专为 Agent 而生的全自研 MiniMax M2 系列模型：

出色规划并稳定执行复杂长链条工具调用任务，协同调用 Shell、Browser、Python 代码执行器和各种 MCP 工具；
SWE-bench Verified Score Evolution 图表显示 MiniMax (M Series) 与 Anthropic (Sonnet/Opus)、OpenAI (GPT)、Google (Gemini) 的得分演进；M2 在 Feb 26 等节点已接近第一梯队水平；
第三方背书：OpenClaw 创始人 Peter Steinberger（@steipete）公开评价”MiniMax is the best alternative”、“I use @MiniMax_AI there as well so it’s quite alright”、“MiniMax is a good option as fallback. OpenAI works well but lacks… character.”；Notion CEO Ivan Zhao（@ivanhzhao）发推：“We added a new model to Custom Agents last night (MiniMax M2.5). Give us cost and performance feedback.”；Notion 模型选择菜单里出现了 MiniMax M2.5（Experimental Open Weight Models）选项。

Memory 记忆系统四要素：

Session Note 工具——将”重要发现/中间结果/用户关键信息”等写入一个结构化或半结构化的记忆对象。记忆可以跨会话存在（重启任务或新的会话交互时仍然可用）；
历史摘要机制——自动执行摘要操作，将旧历史压缩成”记忆摘要”或”核心事实”。维持【最新上下文】+【历史摘要】→ 保障连贯性 + 限制成本；
工具调用与记忆融合——记忆模块可以 Agent 执行过程中的工具使用结果、决策轨迹、关键里程碑。后续步骤、后续会话可以基于这些记忆做检索或引用，维持”状态感知”与”任务连续性”；
可配置的 Token 限制与工作流分割——允许用户设定 max_steps、工作区路径、模型、工具集合。遵从”当历史 Token > 某阈值时压缩成摘要”的上下文管理机制。

上下文管理 6 条工程实践（PPT 用 6 个对比图分别展示 ❌ 和 ✓ 两种做法）：

Design Around the KV-Cache——围绕 KV 缓存进行设计，减少 TTFT 和成本；
Mask, Don’t Remove——在解码中掩蔽有关 token 的 logits，减少模型幻觉；
Use the File System as Context——按需读取和写入，用作存储和结构化的外部记忆；
Manipulate Attention Through Recitation——更新 Todo list，但始终将目标复述到上下文的末尾；
Keep the Wrong Stuff In——将错误的尝试保留在上下文中（让模型从失败中学习）；
Don’t Get Few-Shotted——引入少量的结构化变化增加多样性，避免被 few-shot 套牢。

关键金句

「让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管，每跨一级都是用户心理门槛的产品化跨越。」——冯雯

「Agent 必然会犯错，关键是设计让用户『接受失败』而非『放弃产品』的体验兜底。」——冯雯

「Self-evolution. Each completion of a complex task unlocks a brand-new skill.」——MaxHermes 设计哲学

「首次体验失败是用户流失的主要原因；MiniMax 选『帮我整理这份文件』作为引导任务。」——冯雯

可行建议

做 Agent 产品先把「边界感知 / 信任阶梯 / 失败预期」三件事的设计落到具体页面/交互上，再做功能；
引导任务必须满足「5 分钟内完成 + 成功率高 + 结果可感知 + 自然引导」四条；
用户每一句”不对、重来”都是反馈金矿，建立采集 → 分类 → 量化 → 迭代的产品化闭环；
多端策略不是抹平差异，而是「功能一致、交互适配」；
选 Single-Agent 还是 Multi-Agent，按工具数量和任务复杂度决定，不要追潮流；
Memory 模块要写：Session Note + 历史摘要 + 工具调用记忆融合 + Token 阈值压缩；
上下文工程上至少落实 6 件事：KV-Cache 设计 / Mask 而非 Remove / 文件系统当 Context / Recitation 维持注意力 / 保留错误 / 避免 few-shot 套牢。

关键数据/案例索引

产品/品牌名：

MiniMax、MiniMax Agent（V1 / V2）、海螺 AI、MiniMaxAudio、星野、Talkie、开放平台
MaxClaw（MiniMax + OpenClaw）、MaxHermes（MiniMax Agent + Hermes）、Skillhub
MiniMax Office Skills：MiniMax-docx、MiniMax-xlsx、MiniMax-pdf、PPTX-generator
其他 Skill：html-presentation-generator、industry-research-report、hot-topic-tracker、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、investment-research-analyst、knowledge-digest、prd-to-prototype

模型：MiniMax M Series（M2 / M2.5）、Anthropic Sonnet/Opus、OpenAI GPT、Google Gemini

架构组件：Planner、Executor、Memory、工具注册（MCP 协议 XML 描述）

Memory 关键技术：Session Note、历史摘要、KV-Cache、闪电注意力机制、100 万 token 长上下文

第三方背书：Peter Steinberger（OpenClaw 创始人 @steipete）、Ivan Zhao（Notion CEO @ivanhzhao）

关键数字：

MiniMax Agent V2 上线一个月完成 12 次功能更新
1.5 小时完成复杂任务
100 万 token 长序列处理
信任阶梯 4 级
首次体验任务限 5 分钟

架构论文/参考：Anthropic”How we built our multi-agent research system”、Cognition”Don’t Build Multi-Agents”、LangChain”Benchmarking Multi-Agent Architectures”、Multi-agent System Process Diagram

SWE-bench Verified Score Evolution：MiniMax M Series 在 Feb 25 → Feb 26 期间得分稳步上升，对标 Anthropic、OpenAI、Google 主力模型

OpenClaw 在云上挑战：Security（沙箱逃逸、侧信道、网络访问、数据泄漏）、Functionality（24/7 运行、root 权限、多租户数据共享）、Performance（冷启动慢、规模化资源效率）、Flexibility（无重启更新特性、用户独立升级 OpenClaw）