Chapter 01

AI Agent 的结构与原理

理解 Agent 的五大核心组件，就像理解人脑的不同区域

💡 一句话理解 AI Agent

AI Agent = LLM（大脑）+ 记忆（经验）+ 工具（双手）+ 规划（策略）+ 护栏（安全）
它不是简单的聊天机器人，而是一个能够自主感知、推理、决策和行动的智能系统。就像一个新入职的员工——大脑聪明（LLM），但需要公司给他工具（API）、经验（记忆）、流程（规划）和规范（护栏），才能真正干活。

🧠

LLM 推理引擎

💾

记忆系统

短期 / 长期 / 情景

🔧

工具 & 连接器

API / 数据库 / 搜索

📋

规划 & 编排

任务分解 / 路由

🛡️

护栏 & 治理

安全 / 审计 / RBAC

👁️

可观测性

追踪 / 监控 / 日志

🧠

推理引擎 (Brain)

通常是一个 LLM（如 GPT-4、Claude、Gemini），负责：

理解用户意图和上下文
进行多步推理和逻辑判断
决定何时使用哪个工具
生成最终输出结果

💾

记忆系统 (Memory)

让 Agent 从"金鱼记忆"进化到"过目不忘"：

工作记忆：当前对话上下文窗口
情景记忆：过去的交互经历
语义记忆：领域知识和事实
程序记忆：技能和操作流程

🔧

工具 & 连接器 (Tools)

Agent 的"双手"——连接现实世界的桥梁：

搜索引擎、代码执行器
数据库查询、文件系统操作
第三方 API（CRM、ERP 等）
通过 MCP 协议标准化接入

🛡️

护栏 & 治理 (Guardrails)

确保 Agent 在安全边界内运行：

输入/输出内容安全过滤
权限控制（RBAC + 最小权限）
Human-in-the-Loop 审批机制
操作沙箱隔离与审计日志

🎯 面试关键词

Agent 与传统 Chatbot 的核心区别：自主性（Autonomy）、工具使用（Tool Use）、状态持久化（Statefulness）、多步推理（Multi-step Reasoning）。Chatbot 只能"对话"，Agent 能"做事"。

Chapter 02

AI Agent 设计模式

六大核心设计模式，就像工程师的"武器库"——选对模式，决定项目的成败

💭 思考

→

⚡ 行动

→

👁️ 观察

→

🔄 循环

最常用

1. ReAct 模式 (推理+行动)

Agent 交替进行思考（Thought）和行动（Action），每次行动后观察结果，再决定下一步。

类比：像侦探破案——先推理（嫌疑人可能在酒店），再行动（去酒店调查），观察结果（发现线索），继续推理...

适用：搜索研究、开放式问答、动态决策任务
优势：显著减少幻觉，推理过程可追溯

📝 初稿

→

🔍 自审

→

✨ 改进

质量优先

2. 反思模式 (Reflection)

Agent 生成输出后，自我批评和改进，像一个严谨的作家反复修改文稿。

类比：写论文——先写初稿，再自己审阅（逻辑对吗？数据准吗？），发现问题后修改，直到满意。

适用：代码生成、文案写作、数据分析
优势：代码基准测试准确率提升 15-30%

📐 制定计划

步骤1

步骤2

步骤3

✅ 逐步执行

复杂任务

3. 计划执行模式 (Plan-and-Execute)

先制定完整计划，再按步骤执行。先想清楚，再动手。

类比：装修房子——先出设计方案（拆墙→水电→瓷砖→家具），再按计划一步步施工，而不是走一步看一步。

适用：项目管理、复杂数据处理、多步工作流
优势：行为可预测，适合确定性强的场景

🤖

→ 🔍 搜索引擎

→ 🗄️ 数据库

→ 💻 代码执行

基础能力

4. 工具使用模式 (Tool Use / Function Calling)

Agent 通过 Function Calling 调用外部工具完成特定任务。2026年主流方案是 MCP 协议（AI 的 USB-C 接口）。

类比：人用计算器算数、用搜索引擎查资料——工具让 Agent 突破纯文字生成的限制。

适用：所有需要外部数据/操作的场景
优势：标准化接口，即插即用

🤖 Agent

→

⏸️ 暂停

→

👤 人审批

→

▶️ 继续

高风险必备

5. 人在回路模式 (Human-in-the-Loop)

在关键决策节点插入人工审批环节，不再是"备用方案"，而是生产系统的架构级要求。

类比：银行转账——系统自动处理小额转账，但大额转账需要经理审批。

适用：金融、法律、医疗等高风险场景
优势：可控性强，满足合规要求

🔴 正方

⚔️

🔵 反方

→

🏆 共识

高级模式

6. 多Agent辩论 (Multi-Agent Debate)

多个 Agent 从不同角度互相挑战，通过辩论达成最优解。

类比：法庭审判——原告律师和被告律师辩论，法官综合判决，比一个人拍板更全面。

适用：研究分析、策略制定、复杂推理
优势：多视角验证，减少偏见和遗漏

⚡ 2026 趋势洞察

选对模式比选对模型更重要！生产环境中，大多数项目会组合使用多种模式。例如：用 Plan-and-Execute 拆解任务 → 用 ReAct 执行每个子任务 → 用 Reflection 自检结果 → 关键步骤走 HITL 审批。

Chapter 03

多 Agent 编排与并行

多 Agent 系统是 AI 的"微服务时刻"——让专业的 Agent 做专业的事

📋 主管模式

🔗 流水线模式

🏗️ 层级委派模式

📊 Map-Reduce 模式

👤 用户请求

🧠 主管 Agent（Supervisor）
分解任务 → 分发 → 聚合

🔍 研究员
搜索信息

✍️ 写作者
撰写内容

🔍 审稿人
质量检查

✅ 最终聚合结果

主管模式 (Supervisor / Orchestrator-Worker)

一个"经理" Agent 接收用户请求，将任务分解后分发给不同专长的"员工" Agent 并行执行，最后汇总结果。就像一个项目经理把需求拆成前端、后端、测试任务分配给不同开发者。
框架：LangGraph（Send API）、CrewAI、AutoGen

📥 输入

🔍 Agent A
数据提取

⚙️ Agent B
数据分析

📝 Agent C
报告生成

📤 输出

流水线模式 (Sequential Pipeline)

像工厂流水线：一个 Agent 的输出自动成为下一个 Agent 的输入。最容易调试和监控的模式，因为执行路径是确定的。
适用：ETL流程、内容加工管线、审批工作流
优势：结构清晰、可追踪、容易定位问题

👑 总监 Agent

📊 经理 A
数据部门

员工1

员工2

🎨 经理 B
内容部门

员工3

员工4

层级委派模式 (Hierarchical Delegation)

像公司组织架构：高层 Agent 可以把任务委派给中层 Agent，中层再委派给执行层。Agent 可以动态选择把工作交给谁。
适用：大型企业系统、复杂业务流程
优势：灵活度高、可扩展性强

📦 大任务

📤 MAP — 分发阶段（并行）

🔹 子任务 1

🔹 子任务 2

🔹 子任务 3

📥 REDUCE — 聚合阶段

✅ 最终结果

Map-Reduce 模式

把大任务拆成多个独立子任务并行处理，最后将各子任务的结果汇总。像 Hadoop 的 MapReduce，但用的是 AI Agent。
适用：批量数据分析、多文档摘要、大规模代码审查
优势：极大提升吞吐量，适合可拆分的任务

🔥 主流多Agent框架对比

框架	核心特点	适用场景	学习曲线
LangGraph	有向循环图、精确状态管理、持久化检查点	生产级复杂工作流	⭐⭐⭐⭐
AutoGen	对话模式、动态协作、异步通信	研究分析、代码协作	⭐⭐⭐
CrewAI	角色扮演、团队协作、直觉式设计	内容生产、团队工作流	⭐⭐
Semantic Kernel	Azure 深度集成、多语言支持、企业合规	微软生态企业应用	⭐⭐⭐

Chapter 04

Agent 记忆系统

从"金鱼记忆"到"过目不忘"——四层记忆架构让 Agent 越来越聪明

⚡

工作记忆 (Working Memory)

当前对话的上下文窗口。就像人的"注意力"——当前正在处理的信息。容量有限（受限于 Token 窗口大小），处理完即释放。

📖

情景记忆 (Episodic Memory)

记录具体的过去经历。就像人的"日记"——"上次用户问过 XX，我是怎么解决的"。帮助 Agent 从历史中学习。

🌐

语义记忆 (Semantic Memory)

通用的事实知识库。就像人的"百科全书"——存储在向量数据库（Pinecone、Weaviate）或知识图谱中，通过 RAG 检索。

⚙️

程序记忆 (Procedural Memory)

操作技能和流程规则。就像人的"肌肉记忆"——如何使用工具、遵循 SOP。通过 SKILL.md 等格式标准化定义。

🔑 RAG 不等于记忆系统

RAG（检索增强生成）只是记忆系统的一个技术组件，负责从外部数据库检索相关信息。完整的记忆系统还需要：持久化存储（CRUD操作）、记忆整合（从原始记忆提炼高级洞察）、遗忘机制（清理过时信息）。

2026 趋势：混合架构兴起——向量数据库（语义搜索）+ 知识图谱（关系追踪）+ 类 Zettelkasten 方法（跨知识链接）。

Chapter 05

上下文工程 vs 提示工程

2026 年最重要的范式转变——从"怎么问"到"给什么信息"

🔸 提示工程 (Prompt Engineering)

优化"怎么问"——精心设计单次指令文本

类比：教一个人怎么说话
局限：只能优化单次交互，无法解决根本的架构问题
定位：现在被视为上下文工程的一个子集

🔹 上下文工程 (Context Engineering)

架构"给什么信息"——设计整个信息生态系统

类比：设计一个人的整个学习环境和知识库
包含：检索管线、记忆管理、工具定义、状态追踪
定位：2026 年的核心技术能力

🏔️ 上下文工程成熟度金字塔

Level 4：规范工程 (Specification Engineering)
企业策略、合规标准、行业规范

Level 3：意图工程 (Intent Engineering)
目标定义、权衡取舍、成功标准

Level 2：上下文工程 (Context Engineering)
信息管线、记忆管理、工具编排、状态追踪

Level 1：提示工程 (Prompt Engineering)
指令优化、Few-shot示例、角色设定

💼 面试必知

2026 年面试热词：Context Rot（上下文腐化）——随着对话变长，早期信息被稀释或丢失；Signal vs Noise（信噪比）——不是给 Agent 越多信息越好，而是要精准控制它看到的内容。岗位从"Prompt Designer"进化为"Context Architect"。

Chapter 06

Harness Engineering 详解

没有 Harness，模型只是个"文字生成器"；有了 Harness，它才是一个可靠的 Agent

🎓 什么是 Harness Engineering？

Harness Engineering（线束工程 / 外壳工程）是设计包裹在 AI 模型外围的基础设施、约束和反馈系统的工程学科。

通俗理解：如果 LLM 是一匹马（强大但不受控），Harness 就是马鞍、缰绳和马镫——让骑手（开发者）能安全地驾驭这匹马去到目的地。没有 Harness 的模型就像一匹没有缰绳的野马——跑得很快，但方向不可控。

🏗️ Harness 分层架构

🔐

安全层 (Safety Layer)

输入过滤、Prompt 注入防御、输出审查、敏感信息脱敏

📋

编排层 (Orchestration Layer)

状态机管理、任务分解、路由选择、重试策略、超时控制

🧠

LLM 推理层 (Reasoning Core)

大语言模型核心——可插拔替换（GPT-4 ↔ Claude ↔ Gemini）

🔧

工具层 (Tool Layer)

MCP 连接器、API 网关、数据库接口、沙箱执行环境

💾

记忆层 (Memory Layer)

向量数据库、知识图谱、会话持久化、检查点恢复

📊

可观测层 (Observability Layer)

推理轨迹追踪、性能指标监控、成本归因、异常告警

✨ Harness Engineering 六大优势

🎯

可靠性 & 可预测性

通过验证循环、确定性约束和结构化输出 Schema，将幻觉率降到最低。生产系统不允许"概率性抽风"。

🔄

自纠错能力

Harness 内置"传感器"（反馈循环），Agent 检测到错误后自动回退和修正，无需人工干预即可自愈。

🔌

模型解耦 & 可替换

LLM 变成可插拔组件——底层模型从 GPT-4 换成 Claude 或开源模型，不需要重建整个系统。

📈

复杂任务扩展性

支持多步骤、长周期任务，通过状态持久化和检查点恢复，即使中途失败也能从断点继续。

🔍

深度可观测性

每次失败都变成可定位的工程问题。通过轨迹追踪（Trajectory），精确定位"Agent 在第几步、因为什么而出错"。

🏢

企业级合规

满足 NIST AI RMF、ISO 42001 等合规框架要求，提供完整的审计日志和行为追溯能力。

⚖️ 一个对比理解 Harness

没有 Harness：「给模型一个 prompt → 祈祷它返回正确答案」—— 这是概率性赌博
有了 Harness：「给模型精确的上下文 → 限定它的行动边界 → 验证它的输出 → 失败自动重试」—— 这是工程化保障

Chapter 07

协议标准：MCP & A2A

就像 HTTP 定义了 Web，MCP 和 A2A 正在定义 Agent 的互联互通标准

🔌

MCP

Model Context Protocol

Agent → 工具 Anthropic 发起

AI 的"USB-C 接口"
标准化连接数据库、API、文件系统
每月 1.1 亿+ SDK 下载
Linux 基金会治理
客户端-服务器架构
支持跨应用认证、长任务

🤝

A2A

Agent-to-Agent Protocol

Agent → Agent Google 发起

Agent 间的"外交协议"
发现、协商、委派任务
Agent Card 描述能力
Linux 基金会治理
点对点/中介架构
跨平台 Agent 互操作

🧩 它们不是竞争，而是互补

一个成熟的 AI 系统同时需要两者：
• MCP 让每个 Agent 能"看见"和"操作"外部世界（连数据库、调 API）
• A2A 让不同 Agent 之间能"对话"和"协作"（分工、委派、汇报）

类比：MCP 是每个员工的工作电脑和工具；A2A 是员工之间的沟通协作平台（Slack/Teams）。

Chapter 08

企业级 AI Agent 落地实践

从 Demo 到生产的 8 步路线图——把"实验室玩具"变成"生产力工具"

STEP 01

🎯 需求分析与场景筛选

不要一上来就想做"通用 Agent"！先找到 ROI 最高的场景：任务重复、规则明确、数据充足。从一个小而美的场景切入。

客服工单分类文档提取代码审查数据报告

STEP 02

🏗️ 架构设计与技术选型

选择合适的框架（LangGraph/CrewAI），确定模型方案（云端 vs 私有化），设计状态管理和数据流。产出架构设计文档。

LangGraph MCP 模型选型技术评审

STEP 03

🔧 Harness 构建与工具集成

构建 Agent 外壳系统：集成 MCP 工具连接器、设计记忆管理方案、实现安全护栏（RBAC、输入过滤、操作沙箱）。

工具集成安全护栏记忆系统 Docker化

STEP 04

📐 上下文工程与提示设计

设计信息管线：RAG 检索策略、System Prompt 模板、Few-shot 示例库、动态上下文组装逻辑。这是决定 Agent 质量的核心。

RAG 向量数据库 Prompt 模板知识库

STEP 05

🧪 评估体系建设 (Eval-Driven)

建立自动化评估 Pipeline：设计评估数据集、定义质量指标（准确率/幻觉率/延迟/成本）、实现 CI/CD 集成的回归测试。

评估数据集 A/B测试 LangSmith CI/CD

STEP 06

👁️ 可观测性与监控部署

部署全链路追踪：推理轨迹日志、Token 消耗监控、延迟归因分析、异常行为告警。故障发生时能"时间旅行"回溯。

LangSmith 链路追踪成本监控告警

STEP 07

🚀 灰度发布与渐进上线

先小范围灰度测试（5% 流量），收集真实用户反馈，逐步扩大。配置 HITL 审批机制，关键操作必须人工确认。

灰度发布 HITL 用户反馈渐进扩量

STEP 08

📈 持续优化与治理运营

建立 Agent 运营体系：持续评估性能漂移、更新知识库、优化提示词、管理模型版本、满足合规审计要求。把 Agent 当产品运营。

性能漂移检测知识库更新合规审计产品运营

✅ 生产就绪检查清单

🏗️ 架构

使用有状态模式（非无状态 HTTP 请求）
MCP 标准化工具连接
Docker 容器化部署
检查点和故障恢复机制

🔐 安全

身份认证（服务账号 + 特定权限范围）
RBAC + 零信任原则
Prompt 注入防护
操作沙箱隔离

📊 可观测

推理链路全追踪（Trajectory）
Token 消耗和成本归因
延迟百分位监控（P50/P95/P99）
异常行为实时告警

🧪 质量

自动化评估 Pipeline（Eval Sets）
幻觉率 ≤ 目标阈值
HITL 关键操作审批
性能漂移持续检测

Chapter 09

面试宝典 & 高频考点

30+ 道 AI Agent 面试题精选，含参考答案，拿下面试官

❓ AI Agent 和传统 Chatbot 有什么本质区别？ +

核心区别有四个维度：
1. 自主性：Chatbot 只响应用户输入；Agent 能自主规划、决策和行动
2. 工具使用：Chatbot 只生成文本；Agent 可以调用 API、执行代码、查询数据库
3. 状态管理：Chatbot 通常无状态（每轮独立）；Agent 维护跨步骤/跨会话的持久状态
4. 多步推理：Chatbot 单轮问答；Agent 能分解复杂目标，迭代执行直到完成

一句话总结：Chatbot 只能"说"，Agent 能"做"

❓ 请解释 ReAct 模式的工作原理和适用场景 +

ReAct = Reasoning + Acting，核心是交替循环三个步骤：
Thought（思考）→ Action（行动）→ Observation（观察）→ 循环...

工作流程：Agent 先推理当前情况（"我需要查找 XX 信息"），然后执行工具调用（搜索/查询），观察返回结果，再基于新信息继续推理下一步行动。

优势：推理过程可追溯、显著减少幻觉、适合动态环境
适用场景：搜索研究、开放式问答、需要实时数据的任务
局限：每步都需要 LLM 调用，成本和延迟较高

❓ 多 Agent 系统有哪些编排模式？各自适用什么场景？ +

四种核心编排模式：

1. 主管模式 (Supervisor)：中央 Agent 分发任务给多个 Worker → 适合可并行分解的任务
2. 流水线模式 (Pipeline)：A → B → C 顺序执行 → 适合 ETL 等确定性流程
3. 层级委派 (Hierarchy)：多层级动态委派 → 适合大型企业复杂业务
4. Map-Reduce：拆分并行处理后聚合 → 适合批量分析任务

选择建议：能用 Pipeline 就别用 Supervisor，能用单 Agent 就别用多 Agent——复杂度是有代价的。

❓ 什么是 Context Engineering？它和 Prompt Engineering 有何区别？ +

Prompt Engineering 优化"怎么问"——关注单条指令的措辞技巧。
Context Engineering 架构"给什么信息"——设计整个信息管线。

Context Engineering 包含：检索管线（RAG）、记忆管理、工具定义、状态追踪、动态上下文组装。

2026 年行业共识：Prompt Engineering 是 Context Engineering 的子集。更好的 Prompt 无法解决架构级的信息供给问题。岗位从"Prompt Designer"进化为"Context Architect"。

关键概念：Context Rot（上下文腐化）——对话变长时早期信息被稀释或丢失。

❓ 什么是 Harness Engineering？为什么它对生产系统至关重要？ +

Harness Engineering 是设计包裹在 AI 模型外围的基础设施、约束和反馈系统。

核心价值：把"概率性文字生成器"变成"可靠的生产级系统"。

包含六层：安全层（输入过滤/Prompt注入防御）→ 编排层（状态机/路由/重试）→ 推理层（LLM核心）→ 工具层（MCP/API）→ 记忆层（向量DB/知识图谱）→ 可观测层（追踪/监控/告警）。

关键特性：
• 模型可替换：LLM 变成可插拔组件
• 自纠错：内置反馈循环自动修正错误
• 可观测：失败变成可定位的工程问题，而不是"模型抽风"

❓ MCP 和 A2A 协议各自解决什么问题？它们是竞争关系吗？ +

不是竞争，而是互补关系，解决不同层次的问题：

MCP (Model Context Protocol)：Agent → 工具/数据
• 由 Anthropic 发起，Linux 基金会治理
• 标准化 Agent 连接数据库、API、文件系统的方式
• 类比：每个员工的工作电脑和工具

A2A (Agent-to-Agent)：Agent → Agent
• 由 Google 发起，Linux 基金会治理
• 标准化 Agent 之间的发现、协商和任务委派
• 类比：团队的沟通协作平台（Slack）

生产系统同时需要两者：MCP 让 Agent 能"做事"，A2A 让 Agent 能"协作"

❓ Agent 记忆系统有哪四种类型？请解释各自的作用 +

基于 CoALA 认知架构框架的四层记忆分类：

1. 工作记忆 (Working Memory)：当前上下文窗口 → 人的"注意力"
2. 情景记忆 (Episodic Memory)：过去的交互经历 → 人的"日记"
3. 语义记忆 (Semantic Memory)：通用知识和事实 → 人的"百科全书"
4. 程序记忆 (Procedural Memory)：技能和操作流程 → 人的"肌肉记忆"

重要区分：RAG ≠ 记忆系统。RAG 只是记忆系统的一个技术组件（语义检索），完整的记忆系统还需要持久化存储、记忆整合、和遗忘机制。

❓ 如何从零开始在企业中落地一个 AI Agent？关键步骤是什么？ +

8 步路线图：

1. 场景筛选：选 ROI 最高的场景（重复、规则明确、数据充足）
2. 架构设计：选框架（LangGraph）、选模型、设计状态管理
3. Harness 构建：工具集成（MCP）、安全护栏、记忆系统
4. 上下文工程：RAG、Prompt模板、知识库、动态组装
5. 评估体系：自动化 Eval Pipeline、质量指标定义
6. 可观测性：全链路追踪、成本监控、异常告警
7. 灰度发布：小流量测试 → 收集反馈 → 渐进扩量
8. 持续运营：性能漂移检测、知识库更新、合规审计

核心原则：Start small, scale deliberately（从小处开始，审慎扩展）

❓ 生产环境中，AI Agent 的可观测性为什么如此重要？需要监控什么？ +

因为 Agent 系统是非确定性的——同样的输入可能产生不同的执行路径和输出。你无法用传统的单元测试完全覆盖。

核心监控指标：
• 推理轨迹 (Trajectory)：Thought → Action → Observation 的完整链路
• Token 消耗 & 成本归因：哪个步骤花了最多 Token？
• 延迟分布：P50/P95/P99 百分位延迟
• 幻觉率：输出与事实不符的比例
• 工具调用成功率：外部 API 是否正常
• 状态异常：Agent 是否陷入死循环？

工具推荐：LangSmith（LangChain 生态）可以做"时间旅行"——回溯到任意步骤查看 Agent 当时的状态。

❓ Human-in-the-Loop 在 Agent 系统中扮演什么角色？如何设计？ +

HITL 不再是"备用方案"，而是架构级要求。2026 年的共识：任何涉及高风险操作的 Agent 都必须有 HITL 机制。

设计模式：
• 审批门：关键操作前暂停，等待人工审批后继续
• 置信度阈值：Agent 信心低于阈值时自动请求人工
• 异常路由：检测到异常行为自动转人工处理
• 定期审计：人工定期抽检 Agent 的决策质量

框架支持：LangGraph 原生支持 interrupt() 中断机制，可以在图的任意节点插入人工审批点。

❓ 如何防止 Agent 的 Prompt 注入攻击？ +

Prompt 注入是 Agent 安全的第一大威胁。防御策略：

1. 输入清洗：过滤用户输入中的指令性文本
2. 角色隔离：System Prompt 和 User Input 严格分离
3. 最小权限：Agent 只能访问完成任务所需的最少工具和数据
4. 输出验证：对 Agent 的工具调用参数进行 Schema 校验
5. 沙箱执行：代码执行等高风险操作在隔离环境中运行
6. 审计日志：所有推理和操作轨迹不可篡改记录

关键原则：Defense in Depth（纵深防御）——不依赖单一防线

❓ 2026 年 AI Agent 领域最重要的技术趋势是什么？ +

五大关键趋势：

1. Context Engineering > Prompt Engineering：管理信息管线比优化提示词更重要
2. 编排层 > 模型智能：用小而精的模型 + 优秀的编排，比盲目追求最强模型更划算
3. 协议标准化：MCP + A2A 成为行业标准，Agent 生态从碎片化走向互联互通
4. 可观测性优先：从"能跑就行"到"每一步都可追踪"
5. Agentic Web：Agent 不再只是聊天界面，而是通过 API 和协议成为互联网的一等公民

一句话：2026 年的 AI Agent 正在经历它的"微服务时刻"——从单体走向模块化、标准化、可组合。

深入理解 AI Agent 架构与实践