<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>LLM on Hex4C59's Blog</title><link>http://hex4c59.cc/tags/llm/</link><description>Recent content in LLM on Hex4C59's Blog</description><generator>Hugo -- 0.150.0</generator><language>zh-cn</language><lastBuildDate>Sat, 04 Apr 2026 01:51:57 +0800</lastBuildDate><atom:link href="http://hex4c59.cc/tags/llm/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent Spec：如何用自然语言定义一个可执行系统</title><link>http://hex4c59.cc/agent/agent-spec-design/</link><pubDate>Sat, 04 Apr 2026 01:50:00 +0800</pubDate><guid>http://hex4c59.cc/agent/agent-spec-design/</guid><description>系统解析 Agent Spec 的本质，说明它与普通 Prompt 的区别，并给出一套包含六大核心组件的工程化设计方法论与通用模板。</description></item><item><title>调试 Agent：当你不知道它为什么做了那件事</title><link>http://hex4c59.cc/agent/agent-observability-debugging/</link><pubDate>Sat, 28 Mar 2026 22:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/agent-observability-debugging/</guid><description>从传统软件调试与 Agent 调试的根本差异出发，系统讲解 Agent 可观测性的三支柱——Tracing、Logging、Metrics——的设计与实现，以及如何用 Replay 复现问题、用结构化方法定位 Agent 的隐性错误。</description></item><item><title>Guardrails：如何约束 Agent 不做错事</title><link>http://hex4c59.cc/agent/guardrails-safety-boundary/</link><pubDate>Sat, 28 Mar 2026 16:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/guardrails-safety-boundary/</guid><description>从 Agent 能力越强风险越大的现实出发，系统讲解输入防护、执行防护和输出防护三层安全边界的设计思路与工程实现。</description></item><item><title>什么是 RAG：让大模型用上你自己的知识库</title><link>http://hex4c59.cc/agent/what-is-rag/</link><pubDate>Wed, 25 Mar 2026 12:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/what-is-rag/</guid><description>从检索增强生成的基本流程出发，说明索引、向量化、混合检索与重排序等关键环节，以及 RAG 与微调、Agent 的关系。</description></item><item><title>Skill：不改模型、不写代码，教会 Agent 做专家级别的事</title><link>http://hex4c59.cc/agent/skill-teach-agent-how-to-work/</link><pubDate>Mon, 23 Mar 2026 17:30:00 +0800</pubDate><guid>http://hex4c59.cc/agent/skill-teach-agent-how-to-work/</guid><description>从 Agent 的领域知识鸿沟出发，解释 Skill 这一新兴概念的设计动机、工作机制与实践价值，说明它为什么可能成为 Agent 能力扩展的主流范式。</description></item><item><title>MCP：让 Agent 的工具生态不再各自为战</title><link>http://hex4c59.cc/agent/mcp-model-context-protocol/</link><pubDate>Mon, 23 Mar 2026 17:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/mcp-model-context-protocol/</guid><description>从工具集成的 N×M 问题出发，系统解析 MCP 的架构设计、核心原语、传输机制与安全模型，说明它为什么可能成为 Agent 工具层的基础协议。</description></item><item><title>多 Agent 协作：当一个 Agent 不够用时，如何让多个 Agent 分工合作</title><link>http://hex4c59.cc/agent/multi-agent-collaboration/</link><pubDate>Mon, 23 Mar 2026 16:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/multi-agent-collaboration/</guid><description>解释为什么单 Agent 存在天花板，以及多 Agent 系统的四种编排模式、真实产品中的实现方式与常见失败场景。</description></item><item><title>Reflection：Agent 如何审视自己的输出并纠正错误</title><link>http://hex4c59.cc/agent/reflection-agent/</link><pubDate>Mon, 23 Mar 2026 14:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/reflection-agent/</guid><description>解释 Reflection 为什么是 Agent 的质量保证层，以及如何用输出后审查、执行中自我纠错和多 Agent 交叉审查发现并修正隐性错误。</description></item><item><title>Prompt 设计：Agent 的系统提示词怎么写</title><link>http://hex4c59.cc/agent/prompt-design-agent/</link><pubDate>Mon, 23 Mar 2026 12:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/prompt-design-agent/</guid><description>系统解释 Agent 的 system prompt 应该包含哪些部分、为什么这些部分重要，以及常见 prompt 设计错误该如何避免。</description></item><item><title>工具接口设计：让 Agent 用得好，比让 Agent 用得上更难</title><link>http://hex4c59.cc/agent/tool-interface-design/</link><pubDate>Mon, 23 Mar 2026 11:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/tool-interface-design/</guid><description>解释为什么 Agent 时代的工具接口不能只追求人类可用，并从粒度、返回值、错误处理与状态管理四个维度给出可落地的设计原则。</description></item><item><title>如何评测一个 Agent：不只是看它回答得好不好</title><link>http://hex4c59.cc/agent/agent-evaluation/</link><pubDate>Mon, 23 Mar 2026 10:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/agent-evaluation/</guid><description>解释 Agent 评测为什么不能只看最终答案，并给出覆盖任务完成率、过程合理性、错误恢复与稳定性的评测框架。</description></item><item><title>Planning：当 ReAct 不够用时，Agent 如何提前分解目标</title><link>http://hex4c59.cc/agent/planning-plan-and-execute/</link><pubDate>Sun, 22 Mar 2026 23:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/planning-plan-and-execute/</guid><description>解释 Planning 为什么是复杂 Agent 任务的必要上层结构，以及 Plan-and-Execute 如何把任务分解、执行与检查点串成稳定闭环。</description></item><item><title>ReAct：模型如何让推理与行动交替运转</title><link>http://hex4c59.cc/agent/react-paradigm/</link><pubDate>Sun, 22 Mar 2026 22:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/react-paradigm/</guid><description>解释 ReAct 如何让模型在推理与行动之间交替运转，以及它为什么是 Agent 推理机制的基础范式。</description></item><item><title>上下文与记忆：Agent 为什么会在长任务中失去方向，以及如何设计状态管理</title><link>http://hex4c59.cc/agent/context-memory-state-management/</link><pubDate>Sun, 22 Mar 2026 20:30:00 +0800</pubDate><guid>http://hex4c59.cc/agent/context-memory-state-management/</guid><description>解释 Agent 在长任务中出现“失忆”、目标漂移与重复调用工具的根本原因，并给出可落地的状态管理设计。</description></item><item><title>Tool Use：为什么它是 Agent 的核心能力</title><link>http://hex4c59.cc/agent/tool-use-core-of-agent/</link><pubDate>Sun, 22 Mar 2026 18:00:00 +0800</pubDate><guid>http://hex4c59.cc/agent/tool-use-core-of-agent/</guid><description>从模型的封闭性出发，解释 Tool Use 为什么是 Agent 与外部世界连接的关键接口，以及工程上如何把工具系统设计到真正可用。</description></item><item><title>什么是 Agent：从聊天助手到可执行系统</title><link>http://hex4c59.cc/agent/what-is-agent/</link><pubDate>Sun, 22 Mar 2026 16:30:00 +0800</pubDate><guid>http://hex4c59.cc/agent/what-is-agent/</guid><description>从目标、工具、状态与执行闭环几个角度理解 Agent，说明它和普通聊天机器人、固定工作流之间的区别。</description></item></channel></rss>