RAG 引用溯源设计

介绍 RAG 回答为什么必须保留引用来源，以及 source_url、heading_path、chunk_id 的设计方法。

RAG 引用溯源解决的是让回答和来源一一对应的问题。没有引用溯源，用户就无法判断答案依据，系统也很难进入严肃业务场景。

在 Way To Agent 的知识体系里，这篇文章关注的是 RAG 回答为什么必须保留引用来源，以及 source_url、heading_path、chunk_id 的设计方法。

没有引用会发生什么

没有引用时，用户只能看到一个“像是真的”的答案，却不知道它依据什么。

这在三个场景里会直接出问题：

所以引用不是回答后的装饰，它本身就是 RAG 可上线的前提之一。

引用溯源的工作方式是把每个答案都和具体 chunk、标题路径和来源链接绑定起来。

用户输入
  -> 业务上下文与权限判断
  -> 数据、检索、Prompt 或工具编排
  -> 模型调用或确定性服务执行
  -> 结构化校验、引用、日志和反馈

绑定回去这一步如果做不稳，后面的展示、审计和评估都会跟着失真。

如果字段不够，引用看起来能展示，实际上也没法真正追踪。

最小字段集至少应包含：

chunk_id
doc_id
doc_version_id
source_url
title
heading_path
quote_text 或可截取原文的定位信息

其中最容易被低估的是 doc_version_id。没有它，文档更新后你很难判断一次旧回答到底对应哪一版内容。

前端和日志对引用的需求不同，但都依赖同一组底层字段。

前端需要：

日志和评估需要：

同一组引用字段，同时服务展示、审计和评估，这就是它必须从一开始就设计清楚的原因。

当引用溯源相关功能表现不稳定时，不要先猜模型不好。更有效的排查顺序是：

输入是否明确
上下文是否正确
权限与数据范围是否匹配
Prompt / 工具 / 检索配置是否符合预期
模型调用是否超时、限流或输出不合规
日志、引用和评估样例是否能复现问题

排查引用问题时，关键不是先问“模型有没有引用”，而是先问“引用和具体 chunk、文档版本有没有真正绑定上”。

RAG 引用溯源设计的核心不是记住一个名词，而是理解它在 AI 应用链路中的责任边界。没有引用溯源的 RAG 很难进入严肃业务场景，因为用户无法判断答案依据。

1. 列出前端展示、日志审计、评估复现各自需要哪些引用字段。
2. 明确引用和 chunk_id、doc_version_id 的绑定关系。
3. 想清楚文档更新后，旧回答如何继续追踪原始依据。

04-rag/001-what-is-rag.md
04-rag/002-rag-architecture.md
04-rag/003-document-parsing.md