Agent

Intermediate Concept agent-engineering

Agent Spec：如何用自然语言定义一个可执行系统

系统解析 Agent Spec 的本质，说明它与普通 Prompt 的区别，并给出一套包含六大核心组件的工程化设计方法论与通用模板。

#agent-spec #prompt-engineering #workflow #design-pattern

LangChain

Intermediate Concept agent-engineering

Human-in-the-Loop：Agent 什么时候应该停下来问你

从全自动 Agent 的真实风险出发，系统讲解 HITL 的三种介入模式、触发时机设计、暂停与恢复的工程实现，以及如何避免 Alert Fatigue 让 HITL 形同虚设。

#hitl #human-in-the-loop #safety #autonomy #agent-design

OpenAI

Intermediate Tutorial agent-engineering

Skill 实战：教 Agent 写你风格的博客

用 Python 构建一个 Skill 驱动的写作 Agent——通过可插拔的 Skill 文件教它你的博客风格、文章结构和技术规范，展示 Skill 如何让 Agent 从通用工具变成领域专家。

#skill #knowledge #prompt-engineering #writing-agent #domain-expert

OpenAI

Intermediate Tutorial agent-engineering

持久记忆实战：让 Agent 跨会话记住用户

用 Python 构建一个具备跨会话持久记忆的对话 Agent——通过情景记忆和语义记忆的分层设计，让 Agent 记住过去发生了什么、用户是谁、喜欢什么，真正实现「每次对话都比上次更懂你」。

#memory #persistent-memory #episodic-memory #semantic-memory #user-modeling

OpenAI

Intermediate Tutorial agent-engineering

MCP 集成实战：让 Agent 连接真实服务

用 Python 构建一个通过 MCP 协议动态发现和调用工具的 Agent——连接文件系统、GitHub 和 SQLite 三个真实的 MCP Server，展示从硬编码工具到协议驱动工具的架构升级。

#mcp #tool-use #dynamic-tools #protocol #integration

OpenAI Anthropic

Advanced Tutorial agent-engineering

Multi-Agent 实战：用 Supervisor 模式构建代码审查系统

用 Python 构建一个多 Agent 代码审查系统——Supervisor Agent 协调逻辑、安全、性能三个专家 Agent 并行审查 PR，交叉检验后生成结构化审查报告。

#multi-agent #supervisor #code-review #parallel-execution #cross-review

OpenAI

Intermediate Concept agent-engineering

调试 Agent：当你不知道它为什么做了那件事

从传统软件调试与 Agent 调试的根本差异出发，系统讲解 Agent 可观测性的三支柱——Tracing、Logging、Metrics——的设计与实现，以及如何用 Replay 复现问题、用结构化方法定位 Agent 的隐性错误。

#observability #debugging #tracing #logging #metrics #evaluation

OpenAI Anthropic

Intermediate Tutorial agent-engineering

文件管理 Agent 实战：当操作不可逆时，Guardrails 怎么落地

用 Python 构建一个带完整安全防护的文件管理 Agent——权限分级的工具集、Dry-run 预览机制、操作审批流程和 Undo 回滚能力，展示 Guardrails 如何嵌入 ReAct 执行循环。

#file-management #guardrails #dry-run #undo #permissions #tool-use

OpenAI

Advanced Tutorial agent-engineering

Research Agent 实战：从 RAG 到自主研究

从传统 RAG 的局限出发，用 Python 构建一个能自主制定检索策略、多轮迭代收集信息、评估信息质量并生成结构化研究报告的 Research Agent。

#research-agent #agentic-rag #multi-step-retrieval #information-synthesis #tool-use

OpenAI

Intermediate Concept agent-engineering

Guardrails：如何约束 Agent 不做错事

从 Agent 能力越强风险越大的现实出发，系统讲解输入防护、执行防护和输出防护三层安全边界的设计思路与工程实现。

#guardrails #security #safety #prompt-injection #sandbox #permissions

OpenAI Anthropic

Intermediate Concept agent-engineering

记忆的四种形态：Agent 如何在不同时间尺度上保住它知道的事

从「Agent 为什么会忘事」出发，系统梳理短期、情景、语义与程序四种记忆的定义、适用场景与工程实现，并厘清与 RAG、上下文管理的边界。

#memory #agent #state-management #long-horizon-tasks #rag #context-window

OpenAI Anthropic LangGraph

Beginner Concept agent-engineering

什么是 RAG：让大模型用上你自己的知识库

从检索增强生成的基本流程出发，说明索引、向量化、混合检索与重排序等关键环节，以及 RAG 与微调、Agent 的关系。

#rag #retrieval #embeddings #vector-database #agent

OpenAI Anthropic

Advanced Tutorial agent-engineering

从零构建 CLI Coding Agent：ReAct 驱动的实战实现

用 Python 从零构建一个结构真实的 CLI Coding Agent，涵盖工具注册、ReAct 循环、上下文管理和安全边界的完整实现。

#coding-agent #cli #tool-use #react #state-management

OpenAI

Beginner Concept agent-engineering

什么是 Agent：从聊天助手到可执行系统

从目标、工具、状态与执行闭环几个角度理解 Agent，说明它和普通聊天机器人、固定工作流之间的区别。

#agent #workflow #tools #planning

OpenAI

Advanced Concept agent-engineering

Tool Use：为什么它是 Agent 的核心能力

从模型的封闭性出发，解释 Tool Use 为什么是 Agent 与外部世界连接的关键接口，以及工程上如何把工具系统设计到真正可用。

#tool-use #function-calling #architecture #llm

OpenAI Anthropic

Advanced Concept agent-engineering

ReAct：模型如何让推理与行动交替运转

解释 ReAct 如何让模型在推理与行动之间交替运转，以及它为什么是 Agent 推理机制的基础范式。

#react #reasoning #tool-use #agent #planning

OpenAI Anthropic

Intermediate Concept agent-engineering

Planning：当 ReAct 不够用时，Agent 如何提前分解目标

解释 Planning 为什么是复杂 Agent 任务的必要上层结构，以及 Plan-and-Execute 如何把任务分解、执行与检查点串成稳定闭环。

#planning #plan-and-execute #agent #task-decomposition #reflection

OpenAI Anthropic

Intermediate Concept agent-engineering

多 Agent 协作：当一个 Agent 不够用时，如何让多个 Agent 分工合作

解释为什么单 Agent 存在天花板，以及多 Agent 系统的四种编排模式、真实产品中的实现方式与常见失败场景。

#multi-agent #orchestration #coordination #supervisor #handoff

OpenAI Anthropic LangGraph CrewAI

Intermediate Concept agent-engineering

MCP：让 Agent 的工具生态不再各自为战

从工具集成的 N×M 问题出发，系统解析 MCP 的架构设计、核心原语、传输机制与安全模型，说明它为什么可能成为 Agent 工具层的基础协议。

#mcp #tool-use #protocol #architecture #agent

Anthropic OpenAI

Beginner Concept agent-engineering

Skill：不改模型、不写代码，教会 Agent 做专家级别的事

从 Agent 的领域知识鸿沟出发，解释 Skill 这一新兴概念的设计动机、工作机制与实践价值，说明它为什么可能成为 Agent 能力扩展的主流范式。

#skill #knowledge #prompt #agent #architecture

Cursor OpenAI

Intermediate Concept agent-engineering

工具接口设计：让 Agent 用得好，比让 Agent 用得上更难

解释为什么 Agent 时代的工具接口不能只追求人类可用，并从粒度、返回值、错误处理与状态管理四个维度给出可落地的设计原则。

#tool-use #tool-design #agent #mcp #interface-design

OpenAI Anthropic

Intermediate Concept agent-engineering

Reflection：Agent 如何审视自己的输出并纠正错误

解释 Reflection 为什么是 Agent 的质量保证层，以及如何用输出后审查、执行中自我纠错和多 Agent 交叉审查发现并修正隐性错误。

#reflection #self-critique #quality-control #agent #planning

OpenAI Anthropic

Intermediate Concept agent-engineering

Prompt 设计：Agent 的系统提示词怎么写

系统解释 Agent 的 system prompt 应该包含哪些部分、为什么这些部分重要，以及常见 prompt 设计错误该如何避免。

#prompt #system-prompt #context #agent #tool-use

OpenAI Anthropic

Advanced Concept agent-engineering

上下文与记忆：Agent 为什么会在长任务中失去方向，以及如何设计状态管理

解释 Agent 在长任务中出现“失忆”、目标漂移与重复调用工具的根本原因，并给出可落地的状态管理设计。

#context-window #memory #state-management #agent #long-horizon-tasks

OpenAI Anthropic

Intermediate Concept agent-engineering

如何评测一个 Agent：不只是看它回答得好不好

解释 Agent 评测为什么不能只看最终答案，并给出覆盖任务完成率、过程合理性、错误恢复与稳定性的评测框架。

#eval #agent #reliability #task-completion #testing

OpenAI Anthropic