Agent

记忆的四种形态：Agent 如何在不同时间尺度上保住它知道的事

区分 in-context、情景、语义与程序记忆；说明压缩、检索、更新策略与协作架构，以及常见设计错误与选型问题，可与上下文状态管理与 RAG 两篇对照阅读。

解释 RAG 如何解决大模型知识过时、缺私有知识与幻觉问题，并梳理切片、Embedding、向量库、混合检索与上下文增强等工程要点。

不只是造玩具——这篇文章构建一个结构上真实的 CLI Coding Agent：ReAct 循环驱动多步推理、完整的工具注册机制、上下文窗口管理，以及你在真实工程里必须处理的失败模式。

系统解析 Skill 的概念、动机、结构、发现机制与生态趋势，说明它和 Tool、Prompt、微调的区别，以及为什么「写一份文档」可能比「训练一个模型」更实用。

系统分析 Model Context Protocol（MCP）的设计动机、三层架构（Host-Client-Server）、三种原语（Tools / Resources / Prompts）、传输机制与安全边界，结合实际代码示例说明如何构建和接入 MCP Server。

系统分析多 Agent 协作的核心编排模式（Supervisor、Handoff、Agent-as-Tool、Peer-to-Peer），结合 Claude Code、Cursor、OpenAI Agents SDK 的真实架构，说明多 Agent 系统的设计取舍与工程落地方式。

系统分析 Reflection 在 Agent 系统中的角色、三种实现形态、批评标准设计、失效场景，以及它与 ReAct 和 Planning 的关系。

从角色定义、工具规则、推理格式、约束边界到动态上下文注入，完整拆解 Agent prompt 的设计方法与维护方式。

系统分析面向 Agent 的工具接口设计，说明为什么粒度、返回格式、错误信息和显式状态会直接决定 Agent 的决策质量与恢复能力。

系统分析 Agent 评测与模型评测的差异，说明如何构建测试集、结合自动评测与 LLM-as-judge，并把失败案例转化成可持续的改进信号。