检索系统与向量数据库
文档站本地搜索
介绍 Fumadocs / Orama / 本地 search-index.json 在公开文档站中的作用,以及它与 RAG 语义检索的边界。
检索系统与向量数据库beginnerFumadocsOrama本地搜索静态文档
文档站本地搜索
文档站本地搜索解决的,是“人怎么在知识库里找文章”,不是“模型怎么找上下文”。这两个问题看起来都叫搜索,但目标、索引结构和评价标准并不一样。
如果把它们混成一套系统,后面通常既做不好文档站体验,也做不好 RAG 召回。
文档站搜索要服务谁
它首先服务的是读者,而不是模型。所以它更在意:
- 标题和关键词命中快不快。
- 标签、分类和文章跳转清不清楚。
- 能不能静态部署、低成本运行。
用户来这里不是要拿一段切片当上下文,而是要尽快找到一篇完整文章。
为什么它应该尽量轻
对公开知识库来说,搜索层越轻,部署和维护越稳。像 Fumadocs / Orama / 本地 search-index.json 这类方案的价值,正是:
- 前端就能完成基础搜索。
- 不强依赖后端服务。
- 更新成本低。
这和登录后的 AI 问答,是两种完全不同的系统诉求。
它和 RAG 语义检索的边界
最容易说错的一句话是:“反正都要搜内容,不如统一成一个系统。”问题在于:
- 文档站搜索找的是文章入口。
- RAG 检索找的是适合喂给模型的片段。
一个更像导航,一个更像上下文供应层。内容源可以共用,但索引和目标不该混。
一句话先记住
文档站本地搜索是给人找文章的,不是给模型喂上下文的。
继续阅读
05-retrieval/003-qdrant-basic.md05-retrieval/007-rag-retrieval-stack-selection.md