Anthropic 的 Agent 工程手册

作为开发者,在业务落地时,我们常常陷入困惑:

  • 是该用单体 Agent 还是多 Agent 协作?
  • RAG 检索出来的片段上下文缺失怎么办?
  • Agent 在生产环境出问题如何调试?

如果你正在构建 Agent,必须读读 Anthropic Agent 的最佳实践系列,并按照以下顺序研读:
架构 -> 工具 -> 上下文 -> 协作 -> 评测

在这个日新月异的领域,盲目追逐新框架不如深挖底层逻辑,因为工具会变,但工程原理永存。


Agent 基础架构(入门篇)

  1. Building effective agents
  • 从单轮对话到自主代理
  • 理解 Agent 的基本模式:ReAct、Tool Use、Planning
  1. Building agents with the Claude Agent SDK
  • 用 Agent SDK 构建你的第一个 Agent
  • 实战入门,快速上手

工具与能力扩展(进阶篇)

  1. Introducing advanced tool use on the Claude Developer Platform
  • Agent 高级工具调用:并行、嵌套与错误处理
  • 工具调用的进阶技巧
  1. Writing effective tools for agents — with agents
  • 如何为 Agent 设计好用的工具
  • 工具设计原则和最佳实践
  1. The "think" tool: Enabling Claude to stop and think in complex tool use situations
  • Think Tool:让 Agent 学会"停下来想一想"
  • 复杂推理场景的关键技巧
  1. Equipping agents for the real world with Agent Skills
  • Agent Skills:让 Agent 具备真实世界能力
  • 技能封装与复用

上下文与记忆管理(核心篇)

  1. Effective context engineering for AI agents
  • 上下文工程:Agent 的"记忆"与"注意力"管理
  • 长对话、多轮任务的关键
  1. Introducing Contextual Retrieval
  • Contextual Retrieval:让 RAG 更懂上下文
  • 检索增强的新范式

长任务与多 Agent(高级篇)

  1. Effective harnesses for long-running agents
  • 长时间运行的 Agent:如何设计可靠的执行框架
  • 任务中断恢复、状态持久化
  1. How we built our multi-agent research system
  • 多 Agent 协作系统:Anthropic 的实战经验
  • 多 Agent 架构设计
  1. Code execution with MCP: Building more efficient agents
  • MCP 代码执行:构建更高效的 Agent
  • Agent 执行环境设计

安全、评测与工程化(生产篇)

  1. Demystifying evals for AI agents
  • Agent 评测怎么做
  • 评测体系设计
  1. Beyond permission prompts: making Claude Code more secure and autonomous
  • Agent 安全:从权限提示到沙箱隔离
  • 安全与自主性的平衡
  1. Claude Code: Best practices for agentic coding
  • Coding Agent 最佳实践
  • Coding Agent 的工程经验
  1. A postmortem of three recent issues
  • Agent 故障复盘:三个真实案例分析
  • 从失败中学习
0xMinds

© 2026 0xMinds. All rights reserved.