Agent Spec:如何用自然语言定义一个可执行系统
从 Prompt Engineering 进阶到 Agent Workflow Design。系统分析 Agent Spec 的六大核心组件、四步设计流程以及常见避坑指南,帮你用自然语言定义真正的系统工作流。
从 Prompt Engineering 进阶到 Agent Workflow Design。系统分析 Agent Spec 的六大核心组件、四步设计流程以及常见避坑指南,帮你用自然语言定义真正的系统工作流。
补完评测-调试-修复闭环:Agent 评测告诉你出了问题,可观测性告诉你问题在哪、为什么出问题。涵盖 Trace 设计、结构化日志、关键指标、Replay 复现、常见调试模式和工具链选型。
系统分析 Agent 安全护栏的三层架构——输入防护、执行防护、输出防护——涵盖 Prompt Injection 防御、权限分级、沙箱隔离、敏感信息过滤,以及真实产品中的 Guardrails 设计。
解释 RAG 如何解决大模型知识过时、缺私有知识与幻觉问题,并梳理切片、Embedding、向量库、混合检索与上下文增强等工程要点。
系统解析 Skill 的概念、动机、结构、发现机制与生态趋势,说明它和 Tool、Prompt、微调的区别,以及为什么「写一份文档」可能比「训练一个模型」更实用。
系统分析 Model Context Protocol(MCP)的设计动机、三层架构(Host-Client-Server)、三种原语(Tools / Resources / Prompts)、传输机制与安全边界,结合实际代码示例说明如何构建和接入 MCP Server。
系统分析多 Agent 协作的核心编排模式(Supervisor、Handoff、Agent-as-Tool、Peer-to-Peer),结合 Claude Code、Cursor、OpenAI Agents SDK 的真实架构,说明多 Agent 系统的设计取舍与工程落地方式。
系统分析 Reflection 在 Agent 系统中的角色、三种实现形态、批评标准设计、失效场景,以及它与 ReAct 和 Planning 的关系。
从角色定义、工具规则、推理格式、约束边界到动态上下文注入,完整拆解 Agent prompt 的设计方法与维护方式。
系统分析面向 Agent 的工具接口设计,说明为什么粒度、返回格式、错误信息和显式状态会直接决定 Agent 的决策质量与恢复能力。