Way To Agent
检索系统与向量数据库

文档站本地搜索

介绍 Fumadocs / Orama / 本地 search-index.json 在公开文档站中的作用,以及它与 RAG 语义检索的边界。

检索系统与向量数据库beginnerFumadocsOrama本地搜索静态文档

文档站本地搜索

文档站本地搜索解决的,是“人怎么在知识库里找文章”,不是“模型怎么找上下文”。这两个问题看起来都叫搜索,但目标、索引结构和评价标准并不一样。

如果把它们混成一套系统,后面通常既做不好文档站体验,也做不好 RAG 召回。

文档站搜索要服务谁

它首先服务的是读者,而不是模型。所以它更在意:

  • 标题和关键词命中快不快。
  • 标签、分类和文章跳转清不清楚。
  • 能不能静态部署、低成本运行。

用户来这里不是要拿一段切片当上下文,而是要尽快找到一篇完整文章。

为什么它应该尽量轻

对公开知识库来说,搜索层越轻,部署和维护越稳。像 Fumadocs / Orama / 本地 search-index.json 这类方案的价值,正是:

  • 前端就能完成基础搜索。
  • 不强依赖后端服务。
  • 更新成本低。

这和登录后的 AI 问答,是两种完全不同的系统诉求。

它和 RAG 语义检索的边界

最容易说错的一句话是:“反正都要搜内容,不如统一成一个系统。”问题在于:

  • 文档站搜索找的是文章入口。
  • RAG 检索找的是适合喂给模型的片段。

一个更像导航,一个更像上下文供应层。内容源可以共用,但索引和目标不该混。

一句话先记住

文档站本地搜索是给人找文章的,不是给模型喂上下文的。

继续阅读

  • 05-retrieval/003-qdrant-basic.md
  • 05-retrieval/007-rag-retrieval-stack-selection.md