Anthropic 的 Agent 工程手册 - Jason

Anthropic 的 Agent 工程手册

作为开发者，在业务落地时，我们常常陷入困惑：

是该用单体 Agent 还是多 Agent 协作？
RAG 检索出来的片段上下文缺失怎么办？
Agent 在生产环境出问题如何调试？

如果你正在构建 Agent，必须读读 Anthropic Agent 的最佳实践系列，并按照以下顺序研读：
架构 -> 工具 -> 上下文 -> 协作 -> 评测

在这个日新月异的领域，盲目追逐新框架不如深挖底层逻辑，因为工具会变，但工程原理永存。

Agent 基础架构（入门篇）

Building effective agents

从单轮对话到自主代理
理解 Agent 的基本模式：ReAct、Tool Use、Planning

Building agents with the Claude Agent SDK

用 Agent SDK 构建你的第一个 Agent
实战入门，快速上手

工具与能力扩展（进阶篇）

Introducing advanced tool use on the Claude Developer Platform

Agent 高级工具调用：并行、嵌套与错误处理
工具调用的进阶技巧

Writing effective tools for agents — with agents

如何为 Agent 设计好用的工具
工具设计原则和最佳实践

The "think" tool: Enabling Claude to stop and think in complex tool use situations

Think Tool：让 Agent 学会"停下来想一想"
复杂推理场景的关键技巧

Equipping agents for the real world with Agent Skills

Agent Skills：让 Agent 具备真实世界能力
技能封装与复用

上下文与记忆管理（核心篇）

Effective context engineering for AI agents

上下文工程：Agent 的"记忆"与"注意力"管理
长对话、多轮任务的关键

Introducing Contextual Retrieval

Contextual Retrieval：让 RAG 更懂上下文
检索增强的新范式

长任务与多 Agent（高级篇）

Effective harnesses for long-running agents

长时间运行的 Agent：如何设计可靠的执行框架
任务中断恢复、状态持久化

How we built our multi-agent research system

多 Agent 协作系统：Anthropic 的实战经验
多 Agent 架构设计

Code execution with MCP: Building more efficient agents

MCP 代码执行：构建更高效的 Agent
Agent 执行环境设计

安全、评测与工程化（生产篇）

Demystifying evals for AI agents

Agent 评测怎么做
评测体系设计

Beyond permission prompts: making Claude Code more secure and autonomous

Agent 安全：从权限提示到沙箱隔离
安全与自主性的平衡

Claude Code: Best practices for agentic coding

Coding Agent 最佳实践
Coding Agent 的工程经验

A postmortem of three recent issues

Agent 故障复盘：三个真实案例分析
从失败中学习

© 2026 0xMinds. All rights reserved.