LLM on Hex4C59's Blog

LLM on Hex4C59's Bloghttp://hex4c59.cc/tags/llm/Recent content in LLM on Hex4C59's BlogHugo -- 0.150.0zh-cnSat, 04 Apr 2026 01:51:57 +0800Agent Spec：如何用自然语言定义一个可执行系统http://hex4c59.cc/agent/agent-spec-design/Sat, 04 Apr 2026 01:50:00 +0800http://hex4c59.cc/agent/agent-spec-design/系统解析 Agent Spec 的本质，说明它与普通 Prompt 的区别，并给出一套包含六大核心组件的工程化设计方法论与通用模板。调试 Agent：当你不知道它为什么做了那件事http://hex4c59.cc/agent/agent-observability-debugging/Sat, 28 Mar 2026 22:00:00 +0800http://hex4c59.cc/agent/agent-observability-debugging/从传统软件调试与 Agent 调试的根本差异出发，系统讲解 Agent 可观测性的三支柱——Tracing、Logging、Metrics——的设计与实现，以及如何用 Replay 复现问题、用结构化方法定位 Agent 的隐性错误。Guardrails：如何约束 Agent 不做错事http://hex4c59.cc/agent/guardrails-safety-boundary/Sat, 28 Mar 2026 16:00:00 +0800http://hex4c59.cc/agent/guardrails-safety-boundary/从 Agent 能力越强风险越大的现实出发，系统讲解输入防护、执行防护和输出防护三层安全边界的设计思路与工程实现。什么是 RAG：让大模型用上你自己的知识库http://hex4c59.cc/agent/what-is-rag/Wed, 25 Mar 2026 12:00:00 +0800http://hex4c59.cc/agent/what-is-rag/从检索增强生成的基本流程出发，说明索引、向量化、混合检索与重排序等关键环节，以及 RAG 与微调、Agent 的关系。Skill：不改模型、不写代码，教会 Agent 做专家级别的事http://hex4c59.cc/agent/skill-teach-agent-how-to-work/Mon, 23 Mar 2026 17:30:00 +0800http://hex4c59.cc/agent/skill-teach-agent-how-to-work/从 Agent 的领域知识鸿沟出发，解释 Skill 这一新兴概念的设计动机、工作机制与实践价值，说明它为什么可能成为 Agent 能力扩展的主流范式。MCP：让 Agent 的工具生态不再各自为战http://hex4c59.cc/agent/mcp-model-context-protocol/Mon, 23 Mar 2026 17:00:00 +0800http://hex4c59.cc/agent/mcp-model-context-protocol/从工具集成的 N×M 问题出发，系统解析 MCP 的架构设计、核心原语、传输机制与安全模型，说明它为什么可能成为 Agent 工具层的基础协议。多 Agent 协作：当一个 Agent 不够用时，如何让多个 Agent 分工合作http://hex4c59.cc/agent/multi-agent-collaboration/Mon, 23 Mar 2026 16:00:00 +0800http://hex4c59.cc/agent/multi-agent-collaboration/解释为什么单 Agent 存在天花板，以及多 Agent 系统的四种编排模式、真实产品中的实现方式与常见失败场景。Reflection：Agent 如何审视自己的输出并纠正错误http://hex4c59.cc/agent/reflection-agent/Mon, 23 Mar 2026 14:00:00 +0800http://hex4c59.cc/agent/reflection-agent/解释 Reflection 为什么是 Agent 的质量保证层，以及如何用输出后审查、执行中自我纠错和多 Agent 交叉审查发现并修正隐性错误。Prompt 设计：Agent 的系统提示词怎么写http://hex4c59.cc/agent/prompt-design-agent/Mon, 23 Mar 2026 12:00:00 +0800http://hex4c59.cc/agent/prompt-design-agent/系统解释 Agent 的 system prompt 应该包含哪些部分、为什么这些部分重要，以及常见 prompt 设计错误该如何避免。工具接口设计：让 Agent 用得好，比让 Agent 用得上更难http://hex4c59.cc/agent/tool-interface-design/Mon, 23 Mar 2026 11:00:00 +0800http://hex4c59.cc/agent/tool-interface-design/解释为什么 Agent 时代的工具接口不能只追求人类可用，并从粒度、返回值、错误处理与状态管理四个维度给出可落地的设计原则。如何评测一个 Agent：不只是看它回答得好不好http://hex4c59.cc/agent/agent-evaluation/Mon, 23 Mar 2026 10:00:00 +0800http://hex4c59.cc/agent/agent-evaluation/解释 Agent 评测为什么不能只看最终答案，并给出覆盖任务完成率、过程合理性、错误恢复与稳定性的评测框架。Planning：当 ReAct 不够用时，Agent 如何提前分解目标http://hex4c59.cc/agent/planning-plan-and-execute/Sun, 22 Mar 2026 23:00:00 +0800http://hex4c59.cc/agent/planning-plan-and-execute/解释 Planning 为什么是复杂 Agent 任务的必要上层结构，以及 Plan-and-Execute 如何把任务分解、执行与检查点串成稳定闭环。ReAct：模型如何让推理与行动交替运转http://hex4c59.cc/agent/react-paradigm/Sun, 22 Mar 2026 22:00:00 +0800http://hex4c59.cc/agent/react-paradigm/解释 ReAct 如何让模型在推理与行动之间交替运转，以及它为什么是 Agent 推理机制的基础范式。上下文与记忆：Agent 为什么会在长任务中失去方向，以及如何设计状态管理http://hex4c59.cc/agent/context-memory-state-management/Sun, 22 Mar 2026 20:30:00 +0800http://hex4c59.cc/agent/context-memory-state-management/解释 Agent 在长任务中出现“失忆”、目标漂移与重复调用工具的根本原因，并给出可落地的状态管理设计。Tool Use：为什么它是 Agent 的核心能力http://hex4c59.cc/agent/tool-use-core-of-agent/Sun, 22 Mar 2026 18:00:00 +0800http://hex4c59.cc/agent/tool-use-core-of-agent/从模型的封闭性出发，解释 Tool Use 为什么是 Agent 与外部世界连接的关键接口，以及工程上如何把工具系统设计到真正可用。什么是 Agent：从聊天助手到可执行系统http://hex4c59.cc/agent/what-is-agent/Sun, 22 Mar 2026 16:30:00 +0800http://hex4c59.cc/agent/what-is-agent/从目标、工具、状态与执行闭环几个角度理解 Agent，说明它和普通聊天机器人、固定工作流之间的区别。