jixiaxue 知识库
blog / pm-conference-2026-04-blog · sessions / 2026-04-24-pm-agent-03-fengwen-minimax-openclaw

MiniMax on OpenClaw:Agent 产品设计的实战方法论

0 个章节 · 0 条产出 · 0 条证据
2026-04-24

MiniMax on OpenClaw:Agent 产品设计的实战方法论

会议: 产品力领航者大会 PM × AI · 2026 春季 | 讲者: 冯雯(MiniMax 开放平台产品负责人) | 时间: 2026-04-24 下午 · AI Agent 设计与商业化分会场

一句话总结

MiniMax 在做 Agent 产品时,把”用户认知边界、信任阶梯、失败预期”作为前置设计逻辑,再叠加多端一致性 + 反馈产品化的迭代闭环,并通过拥抱 OpenClaw 开源生态(MaxClaw / MaxHermes / Office Skills)和 M2 模型 + Planner-Executor-Memory-Tools 四件套架构,把”让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管”的能力跨越落到了一款上线一个月迭代 12 次的 MiniMax Agent 上。

速览

  1. 重构设计逻辑三件套——AI Agent 产品先解决「边界感知 / 信任阶梯 / 失败预期」三个底层问题,再谈功能。
  2. 信任阶梯 4 级——让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管,每跨一级都是用户心理门槛的产品化跨越。
  3. 首次体验=产品生死线——首个任务必须小而完整、5 分钟可完成、成功率高、结果可感知,MiniMax 选「帮我整理这份文件」作引导任务。
  4. 失败要透明而非掩盖——保留中间成果支持断点续做、允许用户介入修正后继续,是 Agent 失败兜底的正确姿势。
  5. 多端策略:功能一致 + 交互适配——IM 插件做轻量对话、桌面端做完整功能与本地集成、Web 端做即开即用,统一能力但适配各端形态。
  6. 反馈产品化四步闭环——把”不对、重来、主动修改”等自然语言反馈,自动分类→量化→驱动迭代,形成持续优化循环。
  7. MiniMax Agent V1 → V2 一个月 12 次迭代——支持复杂全栈付费网站(注册登录、订单管理、LLM 调用、定时任务)、Excel 转化数据看板、定制资讯推送等场景。
  8. 拥抱 OpenClaw 开源生态:MaxClaw + MaxHermes + Office Skills——MaxClaw 是 MiniMax + OpenClaw 的桌面端安全沙箱;MaxHermes 是自我进化、24/7 在线、嵌入日常应用的 Agent;Office Skills 开源了 Word / Excel / PPT / PDF 的生产级文档引擎。
  9. 架构选型:Single-Agent 路线——Anthropic、Cognition、LangChain 三家研究均显示单 Agent 在小任务/工具变多时整体表现最优,多 Agent Swarm 仅在工具/信息量极大时占优。
  10. M2 系列模型 + Planner-Executor-Memory-Tools 四件套——M2 在 SWE-bench Verified 上稳步攀升,Notion / OpenClaw 创始人公开背书;Memory 引入 Session Note + 历史摘要机制 + 100 万 token 上下文 + KV-Cache 优化。

核心内容

重构设计逻辑:边界感知 · 信任阶梯 · 失败预期

冯雯在 PART 1 用三个关键词重构了 Agent 产品设计的底层逻辑——这三件事必须先于具体功能解决。

边界感知——核心问题是用户根本不知道 AI 能做什么、不能做什么。设计挑战在于「如何通过设计让能力边界可触摸」,给出 4 个产品化手段:

  1. 能力外显化——主动展示 AI 可完成的任务类型;
  2. 引导式探索——通过示例和模板降低认知门槛;
  3. 渐进式披露——根据使用深度逐步展示高级功能;
  4. 清晰的反馈——当达到能力边界时给出明确提示。

信任阶梯——把”用户从让 AI 看到让 AI 做”的心理门槛拆为 4 级:

Level能力含义
Level 1让 AI 看用户展示信息,AI 只做分析建议
Level 2让 AI 帮AI 辅助执行,用户确认每一步
Level 3让 AI 做AI 自主完成任务,用户只需审核结果
Level 4让 AI 管AI 持续自动化运行,用户设定规则即可

每跨一级,都是产品设计要主动做的工作,不是用户自然进化的结果。

失败预期——Agent 必然会犯错,关键是设计让用户「接受失败」而非「放弃产品」的体验兜底。错误做法是隐藏错误、给模糊提示、让用户从头重来;正确做法是透明展示任务进度和状态、提供清晰的错误原因和解决建议、保留中间成果支持断点续做、允许用户介入修正后继续。

首次体验设计:用户第一个任务应该是什么

PPT 直接给出 4 条原则:

  1. 任务要小而完整——5 分钟内可完成,但能展示完整能力闭环;
  2. 成功率要高——首次体验失败是用户流失的主要原因;
  3. 结果要可感知——用户能清晰看到 AI 完成了什么;
  4. 引导要自然——通过示例而非教程,通过模板而非说明。

MiniMax 的实践案例:选择「帮我整理这份文件」作为引导任务——它符合所有 4 条原则。

多端体验一致性:功能一致、交互适配

策略是「功能一致、交互适配」——能力维度统一,呈现形态各端差异化:

核心定位交互适配
消息平台(IM 插件)快速对话、轻量任务跨设备、卡片式回复、快捷指令
Desktop App(桌面端)完整功能、本地集成文件系统访问、后台运行
Web(网页端)即开即用响应式布局、云端同步

反馈产品化:把自然语言反馈转化为可量化迭代输入

四步闭环:

  1. 采集——捕获用户在对话中的「不对、重来、主动修改」等自然语言反馈;
  2. 分类——自动识别反馈类型(能力缺失 / 理解错误 / 体验问题);
  3. 量化——转化为可追踪指标(任务成功率 / 满意度 / 重试率);
  4. 迭代——驱动产品和模型优化。

迭代结果重新进入采集阶段,形成持续优化循环。

MiniMax Agent V1 → V2:一个月 12 次迭代

V1 能力盘点(PPT 用一张「卢浮宫之旅」的虚拟博物馆案例展示):

  • 编程能力——各种网站、游戏开发交付质量高,运行稳定;
  • 多模态理解——多模态输入理解和多模态输出;
  • 深度研究 DeepResearch——内置大量工具,更多信息源,记忆灵活;
  • MCP 生态支持——内置常用 MCP 工具,支持自定义;
  • PPT——多种可视化展示形态,非套模板。

V2 升级(上线一个月完成 12 次功能更新)

  • 高复杂度全栈网站应用——支持注册登录、实时数据、下单支付、订单管理、LLM 调用、定时任务等;
  • Excel 转化成数据看板——支持定制数据看板、Excel 复杂数据分析、生成 CRM/SaaS 小工具等场景;
  • 定制资讯推送——定制个人订阅网站,用户可设定订阅任务,通过 AI research 能力获取信息推送,还能自主设定推送频率和任意 UI。

桌面端——MiniMax Agent 提供 Mac (ARM/x64) / Windows / iOS / Android 全平台版本,强调两个能力:

  • 本地文件处理——直接读取、写入、整理和分析授权目录下的文件,实现批量处理、格式转换、智能归档;
  • 浏览器接管——Agent 可以像”人”一样操作浏览器,完成真实的点击、填写、提交,而不仅仅是查信息。

拥抱 OpenClaw 开源生态:MaxClaw / MaxHermes / Office Skills

Skillhub 平台——MiniMax Agent 正式上线 Skillhub,精选上百种 Skills 供探索、安装。PPT 展示了 html-presentation-generator、industry-research-report、hot-topic-tracker、minimax-docx、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、minimax-xlsx、pptx-generator、investment-research-analyst、knowledge-digest、prd-to-prototype 等 Skill。Skill 可在微信中调试或在 MaxClaw 中调试。

MaxClaw = MiniMax + OpenClaw——MiniMax Agent 桌面端部署安全版 OpenClaw,定位「龙虾医生随时诊断修复」:

  • 龙虾医生随时在线,会预置安全诊断 Skill,减少 OpenClaw 高危操作风险,并根据 OpenClaw 报错提示自主诊断修复;
  • MaxClaw 沙箱服务升级,稳定性全面优化;
  • 新环境支持 root 权限,用户可自由安装依赖库与浏览器,也可在 OpenClaw 框架更新时自行升级,灵活性拉满。

PPT 同时展示了 OpenClaw 在云上规模化运行的挑战(Security 沙箱逃逸/侧信道、24/7 运行时要求、规模下成本控制、特性更新无须重启等)以及 MaxClaw Framework 的 Unified Scalable Architecture 架构图(包含 Public Access Layer、ML Layer、Storage Layer 等)。

MiniMax Office Skills——开源一套生产级办公文档引擎

Skill能力技术栈
MiniMax-docxWord 文档创建、编辑、模板应用.NET OpenXML SDK + C#
MiniMax-xlsxExcel 数据看板、加载、编辑、公式应用XML、直接生成 + Python
MiniMax-pdf可视化 PDF 生成、15 种封面设计模式ReportLab + Playwright
PPTX-generatorPPT 演示文稿创建与编辑PptxGenJS + XML

MaxHermes = MiniMax Agent + Hermes——三个核心定位:

  • Self-evolution:Each completion of a complex task unlocks a brand-new skill(每完成一个复杂任务就解锁一个新技能);
  • Always on, zero wait:Live in 10 seconds, running 24/7 in the cloud(10 秒上线,云端 24/7 运行);
  • Right where you need it:Accessible in your daily apps, with expanding support for more(可在日常应用中访问,支持范围持续扩大)。

Agent 架构设计:Single Agent vs Multi-Agent 的选择

冯雯引用 Anthropic、Cognition、LangChain 三家公司的研究(“How we built our multi-agent research system”、“Don’t Build Multi-Agents”、“Benchmarking Multi-Agent Architectures”)做出选型分析:

维度Single AgentMulti-Agent (Supervisor)Multi-Agent (Swarm/Team)
架构描述单一 Agent 拥有全部工具与指令,直接处理所有任务主 Agent 接收任务 → 分派给 Sub Agent → 汇总结果所有 Agent 对等,可互相 handoff,关注某一时刻由一个 Agent 活跃
适用场景单一任务,工具数量少,路径简单任务复杂,需要分工与汇总多元任务、工具繁杂且需要快速响应使用者
复杂任务表现在任务/工具变多时效能迅速下滑在高干扰、多任务中表现稳定,但需 Lead Agent 回传结果在高干扰、多任务中表现最佳,可直接面向使用者回应
优点简单直接,无需协调成本结构化管理复杂任务,稳定性高最具灵活度,对复杂 context 抗干扰能力强
缺点对杂乱 context 抵抗力弱需额外协调(Lead Agent 汇总)Agent 之间切换复杂,但表现最佳
实验结论小任务最强,大任务最弱复杂任务中表现稳定工具多、信息量大时整体表现最优

冯雯把 MiniMax Agent 的架构定位在 Single-Agent 路线,并配合下面四件套来弥补单 Agent 在复杂任务中的弱点。

MiniMax Agent 架构四件套

  1. Planner 规划器——任务解析、拆解与执行路径规划:将用户指令拆解为子任务、识别子任务间依赖关系、制定工具调用与推理的顺序、实现「交错思维链」机制;
  2. Executor 执行器——子任务执行与结果处理:按规划执行具体操作、协调多模态模型调用、处理条件分支与循环控制、整合并返回最终结果;
  3. Memory 记忆系统——上下文管理与长期记忆:维护超长上下文窗口、实现”闪电注意力机制”、支持 100 万 token 长序列处理、提供记忆检索与归纳能力;
  4. 工具注册——第三方工具接入与管理:支持 MCP 协议的 XML 工具描述、实现低代码甚至无代码接入、提供工具调用隔离与审计、构建丰富的应用生态系统。

架构优势:模块化设计组件可独立优化与替换;清晰的协作机制支持复杂任务流程;高效执行路径,实现「1.5 小时完成复杂任务」。

Agent 架构子模块细节

Executor 执行器工具集(PPT 完整列出,按主题归类):

  • 消息类:message_notify_user(向用户发送消息无需回复)、message_ask_user(向用户提问待回复);
  • 文件操作:file_read(读取文件内容)、file_write(写入或附加内容到文件)、file_str_replace(替换文件中的特定字符串)、file_find_in_content(在文件内容中搜索文本)、file_find_by_name(通过名称模式查找文件);
  • Shell 操作:shell_exec(执行 shell 命令)、shell_view(查看 shell 会话内容)、shell_wait(等待运行进程完成)、shell_write_to_process(向运行中的进程发送输入)、shell_kill_process(终止运行中的进程);
  • Browser 操作:browser_view、browser_navigate、URLbrowser_restart、browser_click、browser_input、browser_move_mouse、browser_press_key、browser_select_option、browser_scroll_up / scroll_down、browser_console_exec、JavaScriptbrowser_console_view;
  • 网络/搜索:info_search_web(使用搜索引擎搜索网页)、deploy_expose_port(将本地端口暴露用于公共访问)、deploy_apply_deployment(部署网站/应用程序);
  • 任务流转:make_manus_page(从 MDX 文件创建页面)、idle(指示任务完成)。

PPT 同时展示该 Executor 已用于 PDF 处理、基本任务、搜索三大场景。

Planner 规划器——专为 Agent 而生的全自研 MiniMax M2 系列模型:

  • 出色规划并稳定执行复杂长链条工具调用任务,协同调用 Shell、Browser、Python 代码执行器和各种 MCP 工具;
  • SWE-bench Verified Score Evolution 图表显示 MiniMax (M Series) 与 Anthropic (Sonnet/Opus)、OpenAI (GPT)、Google (Gemini) 的得分演进;M2 在 Feb 26 等节点已接近第一梯队水平;
  • 第三方背书:OpenClaw 创始人 Peter Steinberger(@steipete)公开评价”MiniMax is the best alternative”、“I use @MiniMax_AI there as well so it’s quite alright”、“MiniMax is a good option as fallback. OpenAI works well but lacks… character.”;Notion CEO Ivan Zhao(@ivanhzhao)发推:“We added a new model to Custom Agents last night (MiniMax M2.5). Give us cost and performance feedback.”;Notion 模型选择菜单里出现了 MiniMax M2.5(Experimental Open Weight Models)选项。

Memory 记忆系统四要素

  • Session Note 工具——将”重要发现/中间结果/用户关键信息”等写入一个结构化或半结构化的记忆对象。记忆可以跨会话存在(重启任务或新的会话交互时仍然可用);
  • 历史摘要机制——自动执行摘要操作,将旧历史压缩成”记忆摘要”或”核心事实”。维持【最新上下文】+【历史摘要】→ 保障连贯性 + 限制成本;
  • 工具调用与记忆融合——记忆模块可以 Agent 执行过程中的工具使用结果、决策轨迹、关键里程碑。后续步骤、后续会话可以基于这些记忆做检索或引用,维持”状态感知”与”任务连续性”;
  • 可配置的 Token 限制与工作流分割——允许用户设定 max_steps、工作区路径、模型、工具集合。遵从”当历史 Token > 某阈值时压缩成摘要”的上下文管理机制。

上下文管理 6 条工程实践(PPT 用 6 个对比图分别展示 ❌ 和 ✓ 两种做法):

  1. Design Around the KV-Cache——围绕 KV 缓存进行设计,减少 TTFT 和成本;
  2. Mask, Don’t Remove——在解码中掩蔽有关 token 的 logits,减少模型幻觉;
  3. Use the File System as Context——按需读取和写入,用作存储和结构化的外部记忆;
  4. Manipulate Attention Through Recitation——更新 Todo list,但始终将目标复述到上下文的末尾;
  5. Keep the Wrong Stuff In——将错误的尝试保留在上下文中(让模型从失败中学习);
  6. Don’t Get Few-Shotted——引入少量的结构化变化增加多样性,避免被 few-shot 套牢。

关键金句

「让 AI 看 → 让 AI 帮 → 让 AI 做 → 让 AI 管,每跨一级都是用户心理门槛的产品化跨越。」——冯雯

「Agent 必然会犯错,关键是设计让用户『接受失败』而非『放弃产品』的体验兜底。」——冯雯

「Self-evolution. Each completion of a complex task unlocks a brand-new skill.」——MaxHermes 设计哲学

「首次体验失败是用户流失的主要原因;MiniMax 选『帮我整理这份文件』作为引导任务。」——冯雯

可行建议

  • 做 Agent 产品先把「边界感知 / 信任阶梯 / 失败预期」三件事的设计落到具体页面/交互上,再做功能;
  • 引导任务必须满足「5 分钟内完成 + 成功率高 + 结果可感知 + 自然引导」四条;
  • 用户每一句”不对、重来”都是反馈金矿,建立采集 → 分类 → 量化 → 迭代的产品化闭环;
  • 多端策略不是抹平差异,而是「功能一致、交互适配」;
  • 选 Single-Agent 还是 Multi-Agent,按工具数量和任务复杂度决定,不要追潮流;
  • Memory 模块要写:Session Note + 历史摘要 + 工具调用记忆融合 + Token 阈值压缩;
  • 上下文工程上至少落实 6 件事:KV-Cache 设计 / Mask 而非 Remove / 文件系统当 Context / Recitation 维持注意力 / 保留错误 / 避免 few-shot 套牢。

关键数据/案例索引

产品/品牌名

  • MiniMax、MiniMax Agent(V1 / V2)、海螺 AI、MiniMaxAudio、星野、Talkie、开放平台
  • MaxClaw(MiniMax + OpenClaw)、MaxHermes(MiniMax Agent + Hermes)、Skillhub
  • MiniMax Office Skills:MiniMax-docx、MiniMax-xlsx、MiniMax-pdf、PPTX-generator
  • 其他 Skill:html-presentation-generator、industry-research-report、hot-topic-tracker、stock-financial-analysis、image-creator、openclaw-self-evolution-pack、investment-research-analyst、knowledge-digest、prd-to-prototype

模型:MiniMax M Series(M2 / M2.5)、Anthropic Sonnet/Opus、OpenAI GPT、Google Gemini

架构组件:Planner、Executor、Memory、工具注册(MCP 协议 XML 描述)

Memory 关键技术:Session Note、历史摘要、KV-Cache、闪电注意力机制、100 万 token 长上下文

第三方背书:Peter Steinberger(OpenClaw 创始人 @steipete)、Ivan Zhao(Notion CEO @ivanhzhao)

关键数字

  • MiniMax Agent V2 上线一个月完成 12 次功能更新
  • 1.5 小时完成复杂任务
  • 100 万 token 长序列处理
  • 信任阶梯 4 级
  • 首次体验任务限 5 分钟

架构论文/参考:Anthropic”How we built our multi-agent research system”、Cognition”Don’t Build Multi-Agents”、LangChain”Benchmarking Multi-Agent Architectures”、Multi-agent System Process Diagram

SWE-bench Verified Score Evolution:MiniMax M Series 在 Feb 25 → Feb 26 期间得分稳步上升,对标 Anthropic、OpenAI、Google 主力模型

OpenClaw 在云上挑战:Security(沙箱逃逸、侧信道、网络访问、数据泄漏)、Functionality(24/7 运行、root 权限、多租户数据共享)、Performance(冷启动慢、规模化资源效率)、Flexibility(无重启更新特性、用户独立升级 OpenClaw)