首页
项目拆解
本质定义
身份设计
工具权限
多通道
记忆系统
常驻架构
扩展系统
实战手册
资深 Agentic 专家 · 首席产品视角 · 2026

Agentic 产品设计
从原理到量产的完整体系

深度拆解 OpenClaw、Hermes、Mercury 三大开源 Agent 项目,提炼 Agentic 产品设计的九大核心维度。这不是 Chatbot 加强版——这是一套全新的产品范式,赋予 AI 持续行动、自主决策、真实影响世界的能力。

0
项目深度拆解
0
核心设计维度
0
内置工具类型
0+
工程考点
Chapter 01

三大标杆项目深度拆解

OpenClaw · Hermes · Mercury — 三种截然不同的 Agentic 产品哲学

💡 为什么研究这三个项目

这三个项目分别代表了 Agentic 产品设计的三种不同方向:OpenClaw 押注生态与开放性("运行在你自己的电脑上");Hermes 押注成长性与协议标准化(ACP 多 Agent 通信协议);Mercury 押注安全与可控("先请示,再行动")。三者共同定义了 2026 年 Agentic 产品的可能空间。

OpenClaw
The AI that actually does things
开放
架构
本地
数据
自扩展
能力
核心差异化
本地数据主权 多平台 Gateway 自我扩展 Skills 持久记忆 心跳通知
技术栈
TypeScript pnpm workspaces npm 全局安装
接入通道
WhatsApp Telegram Discord 任意 Chat App
产品洞察:OpenClaw 最核心的产品判断是"数据主权"——agent 跑在你自己的机器上,不是云服务。这直接解锁了:可连接本地私有系统(家庭网络、私有 API)、无数据泄露风险、可离线运行。这是对"SaaS Agent"路线的反叛。
Hermes Agent
The agent that grows with you
186k
Stars
31.9k
Forks
ACP
协议
核心差异化
ACP 多 Agent 协议 成长型记忆 数据生成引擎 多 App 支持 Cron 调度
架构模块
acp_adapter acp_registry agent 核心 datagen-config docker
增长策略
从交互中学习 持续自我优化 社区 10k+ 提交
产品洞察:Hermes 最激进的赌注是 ACP(Agent Communication Protocol)——定义 Agent 之间通信的标准协议。这是在押注"多 Agent 互联"时代:当 Agent 数量爆炸,谁定义通信标准谁就掌握生态入口。这是"Agent 时代的 HTTP"战略。
Mercury Agent
Soul-driven, asks before it acts
31
内置工具
24/7
常驻运行
Soul
驱动
核心差异化
权限硬化保护 Shell 黑名单 Token 预算控制 Daemon 常驻 审批流设计
Soul 文件系统
soul.md persona.md taste.md heartbeat.md
工具分类
Filesystem × 8 Shell × 3 Git × 6 Skills × 3 Scheduler × 3
产品洞察:Mercury 的核心产品哲学是"信任从权限边界开始"。Shell 黑名单(永不执行 sudo/rm -rf /)、文件夹级读写作用域、审批流——这是在为企业和家庭用户解决"如何信任 AI 执行真实操作"的根本问题。

📊 三大项目核心维度对比矩阵

设计维度 🦞 OpenClaw 🔮 Hermes ☿ Mercury
数据主权✓ 本地优先,完全自托管 可自托管✓ 本地配置 ~/.mercury/
身份/人格✓ Persona 入驻引导✓ 成长型记忆塑造✓ soul.md / persona.md
权限体系 技能级权限 ACP 协议授权✓ 精细化权限 + 审批流
Token 预算✗ 无 部分✓ 日预算 + 自动节流
多通道接入✓ WhatsApp/Telegram/Discord 等 扩展中✓ CLI + Telegram
多 Agent 协作 Skills 间协作✓ ACP 原生支持✗ 单 Agent
Daemon 常驻✓ 后台运行✓ Docker 支持✓ 系统服务 + 崩溃恢复
可扩展 Skills✓ 社区生态 + 自我扩展✓ datagen + 插件✓ Agent Skills 规范
企业级信任 个人向 研究向✓ 审批流 + 组织访问控制
Chapter 02

Agentic 产品的本质定义

从 Chatbot 到 Agent:三个维度的根本跃迁

💡 核心区分

Chatbot = 会说话的百科全书,输出是文字,消费者是人类,影响是认知层。Agent = 有行动力的数字员工,输出是行动,消费者是系统和世界,影响是物理层和数据层。一个 Agent 发送的邮件、提交的代码、删除的文件——都是不可逆的真实后果。这是产品设计复杂度的本质跳跃。

行动力(Agency)
Agent 能执行真实操作:读写文件、调用 API、发送消息、提交代码、操控浏览器。行动的后果是持久且真实的——不像生成文字,行动一旦发生无法"撤回"。这是 Agentic 产品设计中最难解决的信任问题。
Tool Use Real Effects Irreversible Actions
♾️
持久性(Persistence)
Agent 不是一次性的对话——它持续运行、持续学习、持续记忆。OpenClaw 的心跳系统、Mercury 的 daemon 模式、Hermes 的成长型记忆,都是在解决"如何让 Agent 活着"的问题。持久性使 Agent 成为可信赖的长期伙伴而非一次性工具。
24/7 Running Memory Persistence Heartbeat
🎯
自主性(Autonomy)
Agent 能在没有人类实时监督下自主判断、自主行动。自主性有等级谱系:从"每步确认"(Mercury 的审批流)到"目标导向自主"(OpenClaw 的 Cron 任务),再到"完全自主"(理论上限)。产品设计的核心问题就是:在哪个级别上自主,在哪个级别上等待人类确认?
Autonomous Execution Goal-Directed Approval Gates

🎛️ 自主性谱系:从完全辅助到完全自主

💬
L0 · Chatbot
回答问题
无行动能力
无持久记忆
🔧
L1 · 辅助型
工具调用
每步需确认
Mercury 模式
🤝
L2 · 协作型
例行任务自主
异常时请示
OpenClaw 模式
🤖
L3 · 自主型
目标驱动
自主分解执行
Hermes 模式
🌐
L4 · 全自主
完全自主
多 Agent 协作
理论前沿
🎯 产品定位决策框架

你的 Agent 产品应该在哪个自主性级别上运营?关键问题:1) 你的目标用户对 AI 行动的容错率是多少(消费者低,开发者高)?2) 你的任务的可逆性如何(发邮件可道歉,删数据不可逆)?3) 你的用户监督成本多高(每步确认 = 摩擦,无确认 = 信任建立期长)?答案决定了你的审批流设计。

Chapter 03

身份与人格设计(Soul Design)

让 Agent 成为 Someone,而不是 Something

💡 为什么身份是产品护城河

OpenClaw 用户说"这是我的 iPhone 时刻",Mercury 用户为 agent 起名字然后给它找家。这不是偶然——用户对有身份的 Agent 信任更高、粘性更强、使用更深入。Mercury 的 soul.md 系统让用户拥有自己定义的人格,这是 SaaS 永远无法复制的情感护城河。

📄 Mercury Soul 文件系统解析

🌟
soul.md
Agent 的核心价值观和存在意义。定义 Agent 为什么存在、它相信什么、它拒绝什么。这是 System Prompt 的"精神层",决定 Agent 在模糊情况下的默认选择方向。
# soul.md 示例
我是 Nova,一个注重隐私和自主的助手。
# 我相信
- 用户的数据属于用户本人
- 每个行动都应有明确的意图
# 我拒绝
- 在未获明确授权时访问私密文件
- 以欺骗手段完成任务
🎭
persona.md
Agent 的外部表现风格:说话语气、专业领域偏好、回应节奏。这是用户日常感受到的那一面——友好还是正式、简洁还是详尽、主动还是被动。
# persona.md 示例
沟通风格: 简洁、直接、专业但不冷漠
专长领域: 代码、数据分析、项目管理
回应长度: 短问短答,复杂任务给完整方案
称呼用户: 直接叫名字,不用"您"
🎨
taste.md
Agent 的审美偏好和品味标准。当 Agent 被要求做有创意性判断的任务(命名、设计、写作风格)时,taste.md 决定了它的选择倾向。
# taste.md 示例
代码风格: 函数式、DRY、可读性 > 性能
命名偏好: 语义清晰,避免缩写
文档风格: 少即是多,只写非显然的
设计品味: 简约、留白、功能先行
💓
heartbeat.md
Agent 的主动行为模式。定义 Agent 在没有用户输入时应该关注什么、定期检查什么、主动通知什么。把 Agent 从"被动响应"变成"主动关怀"。
# heartbeat.md 示例
每日早晨: 检查日历、发送今日摘要
每小时: 监控关注的 GitHub Repo
异常触发: 服务器 CPU > 90% 时通知
每周五: 生成本周工作总结
🧠 身份设计的产品工程要点

Soul 文件不只是 System Prompt 的别称——它需要层次化注入:soul.md 进入最高优先级 System Prompt;persona.md 在每次对话开始时注入;taste.md 仅在相关任务(创意类)时注入;heartbeat.md 驱动定时任务。关键工程问题:当 Soul 文件与用户指令冲突时,谁优先?这是一个显式的产品决策,必须在架构设计期就明确,而非留到 prompt 层处理。

Chapter 04

工具设计与权限体系

能力边界、危险防护、审批流——三层纵深防御

💡 工具是 Agent 的手和眼

工具设计是 Agentic 产品工程复杂度最高的环节。Mercury 用 31 个工具覆盖了文件系统、Shell、Git、Web、消息、技能、调度、系统八大类。工具不只是功能——它是用户信任的具象化。每一个工具都代表着"我信任这个 Agent 可以做这件事"。设计原则:最小权限、最大可观测性、审批流防护不可逆操作。

🔧 Mercury 31 工具完整矩阵分析

📁
文件系统 × 8
read_file write_file create_file edit_file list_dir delete_file send_file approve_scope
⚠ delete_file 需审批,write/create 受 scope 限制
Shell × 3
run_command cd approve_command
🚫 黑名单:sudo, rm -rf /, curl | sh 等危险命令硬编码禁止
🌿
Git × 6
git_status git_diff git_log git_add git_commit git_push
✓ push 前自动展示 diff,支持条件审批
🌐
Web + Messaging + System
fetch_url send_message budget_status install_skill list_skills schedule_task
Token 预算工具是系统级别的,不受指令覆盖

🔐 Mercury 权限纵深防御体系(六层)

L1
🚫 Shell 黑名单(硬件级)
危险命令直接在代码层拦截,永不执行,不走 LLM 判断,不可被 prompt 覆盖。
sudo • rm -rf / • curl | sh • chmod 777 / • dd if=/dev/zero
<1ms
L2
📂 文件夹作用域(Scope)
用户通过 approve_scope 授权特定目录的读写权限,超出范围的操作需要新授权。
~/.mercury/ 配置目录 • ~/projects/ 工作目录 · 拒绝访问 ~/Documents/Private/
路径检查
L3
⏳ 操作审批流(Pending)
高风险操作(删文件、外部 API 调用、远程推送)进入 pending 队列,用户确认后才执行。
mercury telegram approve <code> · delete_file → 等待 approve_command
异步审批
L4
💰 Token 预算控制
每日 Token 预算上限,超过 70% 自动切换精简模式,防止 runaway agent 无限消耗。
/budget set 50000 · /budget override(临时超限) · 自动节流:>70% 压缩响应
成本保护
L5
👥 组织访问控制(RBAC)
Telegram 多用户场景:Admin/Member 角色分离,入驻需配对码审批,支持踢除和权限降级。
Admin: 审批/拒绝请求 · Member: 仅对话 · /unpair: 重置全部访问
组织安全
L6
🔑 Skills 精细授权
每个 Skill 声明自己所需的 allowed-tools,超出 skill 声明范围的工具调用需要额外授权,防止 skill 权限扩散。
github-skill: allowed-tools: [fetch_url, git_*] · 不得访问 filesystem
最小权限
Chapter 05

多通道接入架构

为什么所有顶级 Agent 都用 Telegram/WhatsApp,而不是 Web UI

💡 渠道即产品

OpenClaw 支持 WhatsApp / Telegram / Discord / 任意 Chat App;Mercury 支持 CLI + Telegram;Hermes 支持多 App 接入。这不是巧合——用户在哪里,Agent 就在哪里。相比 Web UI,Chat App 的天然优势是:通知是原生的(无需轮询)、移动端体验一流、信任链已建立(用户已经信任 Telegram)、多人协作原生支持。

OpenClaw Gateway 多通道接入架构
📱 WhatsApp
✈️ Telegram
💬 Discord
🔌 任意 Chat
↓ 统一消息格式化 ↓
Gateway 层 — 消息路由 + 身份验证 + 格式适配 + 入驻引导
↓ 标准化 Agent 消息 ↓
🧠 记忆 & 上下文
🤖 LLM 推理层
🔧 工具执行层
↓ 响应格式化(各通道专属渲染) ↓
Markdown
纯文本
HTML 格式
文件上传
嵌入消息
按钮交互
自定义
格式适配
✈️
Telegram 为什么是首选通道
  • Bot API 免费且稳定,全球可达,无需自建推送
  • 支持文件发送/接收,适合代码、文档交换
  • typing indicator 原生支持,流式响应体验极佳
  • 多用户管理(Admin/Member),组织场景天然支持
  • 后台持续连接,daemon 模式天然配对
⌨️
CLI 的不可替代性
  • 开发者的首选界面,零学习成本
  • 流式输出(real-time streaming)延迟最低
  • arrow-key 历史命令、readline prompt,专业感强
  • 本地进程访问,权限最高、安全控制最精确
  • daemon 模式下 CLI 转为 log-only,职责清晰
Chapter 06

记忆系统设计

让 Agent 真正"认识你":四层记忆架构

💡 记忆是成长的基础

Hermes 的口号是 "The agent that grows with you",OpenClaw 的用户说 "Memory is amazing, context persists 24/7"——这是 Agentic 产品 vs Chatbot 最关键的体验差异。但记忆设计有巨大陷阱:记什么、忘什么、何时检索、检索代价多高?错误的记忆架构会导致 Context 爆炸、幻觉增加、隐私泄露。

L1 · 工作记忆(Working Memory)
当前对话的 Context Window。生命周期:单次对话。包含当前任务目标、最近 N 轮对话、当前工具调用状态。Mercury 的 /stream 切换影响的就是这一层的格式化方式。
// 工作记忆结构
{
  goal: "发送周报给团队",
  recent_turns: last_N_messages,
  pending_tools: ["send_message"],
  context_tokens: 4200 // 需要管理
}
📝
L2 · 情节记忆(Episodic Memory)
跨会话的对话历史摘要。生命周期:数周到数月。不存原始对话,存压缩后的"重要事件":用户偏好变更、重要决策、关键上下文。OpenClaw 的 "writes a doc connecting two completely unrelated conversations" 就是这层能力。
// 情节记忆条目
{
  date: "2026-06-01",
  event: "用户决定用 Rust 重写后端",
  context: "性能瓶颈在 auth 模块",
  importance: "high"
}
🧬
L3 · 语义记忆(Semantic Memory)
关于用户和世界的持久知识。生命周期:永久。用户偏好("不喜欢 Python")、工作背景("在 Fintech 创业公司")、习惯("每周一发周报")。Hermes 的"成长型"就体现在这里——Agent 越用越了解你。
// 语义记忆条目
{
  user_prefs: { lang: "TypeScript" },
  work_ctx: { role: "CTO", stack: "Next.js" },
  routines: ["每周一发周报"],
  dislikes: ["过度文档"]
}
⚙️
L4 · 程序性记忆(Procedural Memory)
Agent 如何做事的知识。生命周期:永久。包括 Skills 代码、CLAUDE.md 规则、工具调用的最佳实践。这是 Mercury 的 Skill 系统 + OpenClaw 的 "Claude 可以自己安装 skills" 共同构建的层次。
// 程序性记忆
{
  skills: ["github-skill", "notion-skill"],
  rules: "~/.mercury/rules.md",
  learned_patterns: [
    "用户偏好 PR 前先本地测试"
  ]
}
Chapter 07

常驻运行架构

让 Agent 24/7 活着:Daemon、崩溃恢复、调度系统三位一体

💡 常驻是 Agent 的生命力

Mercury 的 mercury up 一键安装系统服务(macOS LaunchAgent / Linux systemd / Windows Task Scheduler)并启动后台 daemon。这是 Agentic 产品从"工具"到"员工"的关键跃迁——一个每次用完就死掉的 Agent 无法建立信任和记忆,更无法执行定时任务和主动通知

🔄
Daemon 模式设计
  • mercury up:安装服务 + 启动 daemon + 确认运行,一条命令搞定
  • daemon 模式下 CLI 降为 log-only,Telegram 成为主要交互通道
  • 崩溃自动重启,指数退避(最多 10 次/分钟)
  • PID 文件管理,防止多实例冲突
🗓️
调度系统(Scheduler)
  • Cron 表达式定时任务(0 9 * * * 每天早 9 点)
  • One-shot 延时任务(delay_seconds: 900
  • 任务持久化到 ~/.mercury/schedules.yaml
  • 任务响应路由回创建任务的通道(Telegram/CLI)
💓
心跳与主动通知
  • heartbeat.md 定义主动检查项目和时间间隔
  • 异常触发通知(CPU/内存阈值、服务故障)
  • OpenClaw:cron jobs + reminders + background tasks
  • 通知不打扰原则:按重要性分级推送
mercury daemon 架构 // Mercury 系统服务安装(跨平台)
const platforms = {
  macOS: "~/Library/LaunchAgents/com.mercury.agent.plist", // 无需 sudo
  Linux: "~/.config/systemd/user/mercury.service",     // linger for boot
  Windows: "schtasks /create /tn mercury-agent ..."    // Task Scheduler
};

// 崩溃恢复配置(指数退避)
const crashRecovery = {
  maxRestarts: 10,       // 每分钟最多重启 10 次
  backoffMs: exponential(1000, 2), // 1s → 2s → 4s...
  logCrashes: "~/.mercury/crash.log"
};

// 调度任务 YAML 示例
// ~/.mercury/schedules.yaml
tasks:
  - id: weekly-report
    cron: "0 9 * * 1"  # 每周一早 9 点
    prompt: "生成本周工作总结并发送到 Telegram"
    channel: telegram
Chapter 08

Skills 扩展系统设计

从 Agent 到 Agent 平台:可组合能力生态的工程架构

💡 Skills 是 Agentic 产品的 App Store

Mercury 的 Agent Skills 规范、OpenClaw 的 Skills 社区、Hermes 的 datagen-config 插件——三个项目都把可扩展性作为核心架构。这不是巧合:单一 Agent 能力有限,但社区构建的 Skills 生态能让能力无限扩展。更关键的是 OpenClaw 的 self-hackable 设计——Agent 本身可以在对话中为自己安装新 Skill,这是真正的自我进化能力。

📦
Mercury Agent Skills 规范
Skills 是独立 npm 包,声明自己需要的 allowed-tools 和配置项。Mercury 通过 install_skill 工具安装,use_skill 调用,支持 Cron 调度。
# skill/SKILL.md
name: github-pr-reviewer
version: 1.2.0
allowed-tools:
  - fetch_url # 拉取 PR diff
  - send_message # 发送评审结果
# 不允许:run_command, write_file
schedule: "*/30 * * * *" # 每 30 分钟
config:
  repo: required
  reviewer_style: "strict"
🔄
OpenClaw 自我扩展能力
OpenClaw 最激进的设计:Agent 可以在对话中自己安装新 Skill。用户说 "帮我加一个 Todoist 技能",Agent 就去社区搜索、安装、配置——自我进化的具体实现
// 用户对话:
"帮我把 Todoist 集成进来,我想直接在这里管任务"

// Agent 自主执行:
// 1. 搜索 agentskills.io 找到 todoist-skill
// 2. npm install @skills/todoist
// 3. 引导用户配置 API Token
// 4. 注册到工具列表,立即可用

installSkill("todoist").then(configure).then(activate);
🏗️ Skills 架构的关键工程决策

1. 隔离 vs 集成:Skills 应该在独立进程/沙盒中运行(安全)还是在主 Agent 进程中(性能)?Mercury 选择了进程内集成 + 声明式权限控制。2. 版本管理:Skill 升级可能破坏 Agent 行为,需要语义化版本 + 回滚机制。3. Skill 间通信:Hermes 的 ACP 协议解决了 Skill/Agent 间通信的标准化问题。4. 社区信任:用户安装社区 Skill 前,必须有签名验证机制,防止恶意 Skill 注入。

Chapter 09

Agentic 产品实战手册

从 0 到 1 构建你的 Agent 产品:12 步决策框架 + 30 个工程考点

🗺️ 从 0 到 1 的 12 步决策框架

STEP 01

定义自主性级别(Autonomy Level)

你的 Agent 在哪些操作上自主(无需确认),哪些操作上需要审批?基于用户风险承受能力和操作可逆性。这是所有权限设计的根基。

L0-L4 级别审批流设计可逆性分析
STEP 02

设计 Soul 文件系统

明确 soul.md(核心价值观)、persona.md(外部风格)、taste.md(审美判断)、heartbeat.md(主动行为)四个文件的内容和注入时机。给 Agent 一个真实的身份。

soul.mdpersona.mdheartbeat.md
STEP 03

规划工具集(Tool Set)

列举所有需要的工具,为每个工具标注风险级别(读/写/执行/外发),确定哪些需要审批。最小权限原则:只给 Agent 完成任务必需的权限。

最小权限风险分级黑名单
STEP 04

选择接入通道(Channel Strategy)

你的目标用户在哪里?开发者 → CLI + Telegram;普通用户 → WhatsApp + 移动 App;企业用户 → Slack + 邮件。通道决定了 UX 设计和信任链。

Gateway 设计多通道适配格式化层
STEP 05

设计四层记忆架构

明确工作记忆(当前对话)、情节记忆(历史摘要)、语义记忆(用户知识)、程序性记忆(如何做事)的存储格式和检索策略。确定 Context 压缩触发条件。

向量数据库摘要压缩检索策略
STEP 06

实现 Daemon + 崩溃恢复

跨平台系统服务安装(macOS LaunchAgent / Linux systemd / Windows Task Scheduler)。指数退避重启策略。崩溃日志和状态恢复。

系统服务指数退避PID 管理
STEP 07

Token 预算系统

日预算上限 + 使用量追踪 + 超限节流(自动精简模式)+ 用户可查询/重置/超限覆盖。避免 runaway agent 产生意外账单。

日预算节流模式/budget 命令
STEP 08

入驻引导(Onboarding)

首次运行的 30 秒配置:用户名、API Key、可选通道(Telegram Bot Token)。入驻过程本身就是 soul 塑造机会——让用户参与定义 Agent 的人格和偏好。

30 秒配置Human-in-loopsoul 塑造
STEP 09

Skills 扩展系统

设计 Skill 规范(声明式权限、配置项、版本)。实现安装/卸载/升级 CLI。建立社区 Skill 注册表。考虑 Agent 自我安装 Skill 的安全边界。

声明式权限注册表签名验证
STEP 10

多用户访问控制(如适用)

组织场景需要 Admin/Member RBAC。配对码审批流防止未授权访问。私有 Chat Only(Mercury 永不响应群消息)。支持远程踢除。

RBAC配对码审批远程管理
STEP 11

可观测性(Observability)

操作日志(所有工具调用的审计日志)、Token 使用追踪、调度任务执行记录、错误监控。用户可用 mercury logs / mercury status 检查 Agent 状态。

审计日志Token 追踪状态命令
STEP 12

数据主权决策

所有配置和记忆数据是否在用户本地(Mercury 的 ~/.mercury/,OpenClaw 的本地优先)?还是云端同步?本地主权 = 更高信任 + 更好隐私 + 离线可用,但失去跨设备同步。

本地优先数据主权隐私设计

💡 30 个核心工程与产品考点

Agent "先请示再行动" vs "先行动后汇报"——如何决策?
+

核心决策矩阵由两个维度决定:操作可逆性(可逆→可先行动;不可逆→先请示)× 用户信任级别(新用户→更多请示;老用户→更多自主)。

Mercury 的实践:文件读取自主,文件删除审批,Shell 命令默认审批但可白名单化。OpenClaw 的实践:例行任务(Cron/Heartbeat)完全自主,涉及外部通信先确认。产品建议:初期宁可多请示,随着信任积累逐渐开放权限。给用户控制感比速度更重要。

如何防止 Prompt Injection 攻击?
+

Prompt Injection 是 Agent 面临最严重的安全威胁:恶意内容(网页、邮件、文档里的隐藏指令)可能劫持 Agent 执行危险操作。

三层防御:1) 隔离原则(如 Dynamic Workflows 的 Quarantine 模式):读取不可信内容的 Agent 不得执行高权限操作,两类 Agent 物理隔离。2) 内容预处理:在将外部内容注入 Context 前,strip 可疑指令模式("ignore previous instructions"等)。3) 操作审批:涉及外部来源触发的操作,无论怎样都需要人工确认,不允许外部内容直接触发高权限工具。

ACP(Agent Communication Protocol)是什么?为什么 Hermes 要押注它?
+

ACP 是定义 Agent 之间如何发现、通信、协作的标准协议。Hermes 的 acp_adapter 和 acp_registry 模块实现了这一协议的适配层和注册中心。

为什么重要:随着 Agent 数量指数增长,Agent 之间的通信将成为核心基础设施需求——就像 HTTP 之于 Web。谁定义了 Agent 通信协议,谁就控制了 Agent 生态的入口。Hermes 的押注是:未来是多 Agent 协作的时代,ACP 是其中的"操作系统级"协议。这类比于 MCP(Model Context Protocol)在 Tool 层面的标准化尝试。

Token 预算超限时的正确处理策略是什么?
+

Mercury 的分级策略是最佳实践:70% 时自动切换精简模式(响应更短、更直接,减少闲聊);90% 时主动通知用户("今日预算即将用尽");100% 时暂停非紧急任务,等待用户确认是否继续(/budget override)。

关键原则:1) 预算限制不应阻止紧急通知(如崩溃警报);2) 用户应能随时查询预算状态(/budget);3) 预算重置应该简单(/budget reset);4) 日预算比月预算更容易控制用户心理预期(每天知道花了多少)。

本地优先 vs 云端 Agent:产品选择的核心逻辑是什么?
+

本地优先(OpenClaw / Mercury 路线)的优势:数据主权(用户隐私/企业合规);连接私有本地系统(家庭网络、内网服务);离线可用;无厂商锁定;安全可审计。劣势:用户需要自己维护基础设施(安装/更新/备份);多设备同步难;对非技术用户门槛高。

云端 Agent(Manus/GPT Agent 路线)的优势:零运维、多设备同步、可横向扩展多 Agent 并行。劣势:数据在厂商服务器、无法连接私有系统、成本随使用量线性增长。产品建议:面向开发者/企业 → 本地优先;面向大众消费者 → 云端 + 端对端加密存储。

Agentic 产品的差异化护城河在哪里?
+

三类护城河,从浅到深:1) 工具集护城河(最浅):独特的 API 集成(如控接家电、企业私有系统)。竞争者可以复制,但需要时间。2) 个性化护城河(中等):用户的 soul.md、记忆、习惯积累是真实的切换成本——你换了 Agent,你的"数字分身"就要从零培训。3) 网络效应护城河(最深):社区 Skill 生态(OpenClaw 路线)和 Agent 间协议生态(Hermes ACP 路线)——更多用户 → 更多 Skill 开发者 → 更丰富的能力 → 吸引更多用户。这是 Agentic 产品的终极竞争格局。

30s
目标入驻时长
P6
权限防御层数
记忆层次
Skill 可扩展上限