搜索

第一阶段使用本地内容索引检索标题、摘要、分类和标签，不依赖 arbor-api 或模型调用。

全部文章

36 条

大模型应用基础beginner

大模型应用基础概念

介绍 AI 应用开发中必须理解的 Token、上下文窗口、模型参数、System Prompt 和输出不确定性。

LLM Token Context Window Temperature

大模型应用基础intermediate

模型选择与参数调优

说明在 AI 应用工程里如何选择模型、调节参数和控制输出边界，以及什么时候不该走微调路线。

模型选择参数调优 Temperature 上下文窗口

大模型应用基础beginner

流式输出与 SSE

介绍大模型流式输出的价值、SSE 事件设计、Java 转发和前端展示边界。

SSE Streaming WebClient 前端展示

导学与路线beginner

Way To Agent 是什么

介绍 Way To Agent 的定位、知识图谱和阅读方式，说明它如何围绕 AI Agent 构建系统化知识库。

Way To Agent AI Agent 知识库 Agent学习

导学与路线beginner

什么是 AI Agent

解释 AI Agent 的定义、组成和边界，为后续 RAG、工具调用、记忆、规划和编排知识建立主线。

AI Agent Agent基础 Tool Calling RAG

检索系统与向量数据库beginner

文档站本地搜索

介绍 Fumadocs / Orama / 本地 search-index.json 在公开文档站中的作用，以及它与 RAG 语义检索的边界。

Fumadocs Orama 本地搜索静态文档

检索系统与向量数据库beginner

Qdrant 基础

介绍 Qdrant 的 Collection、Point、Vector、Payload 和过滤查询，以及它在中小型知识库系统 RAG 中的职责。

Qdrant Vector Database Payload Filter

检索系统与向量数据库intermediate

RAG 检索层选型：Fumadocs、Qdrant、Elasticsearch、Milvus、pgvector 怎么选

系统拆解自建 RAG 服务的检索层选型逻辑，解释文档站搜索、语义检索、向量数据库和全文检索的边界，并说明中小型知识库系统为什么采用 Fumadocs / Orama + Qdrant 的组合。

RAG 检索选型 Fumadocs Qdrant Elasticsearch Milvus pgvector

Agent 与工具调用beginner

Agent 是什么

解释 Agent 与 Chatbot、LLM、Workflow 的区别，以及任务、工具、状态和安全边界。

Agent Tool Calling Memory Planning

Agent 与工具调用beginner

Function Calling 与 Tool Calling

介绍工具调用的基本流程、参数 Schema、服务端校验、失败处理和调用日志。

Function Calling Tool Calling 参数 Schema 工具权限

AI Agent 应用工程化与可观测性beginner

AI Agent 应用工程化是什么

介绍 AI Agent 应用从 Demo 走向生产系统需要补齐的日志、评估、监控、成本、安全和降级能力。

AI工程化可观测性成本控制安全

AI Agent 应用工程化与可观测性intermediate

AI 调用日志设计

介绍 AI 调用日志应记录哪些字段，如何支撑额度扣减、故障排查、质量评估和审计。

AI调用日志审计 RAG 额度

AI Agent 应用工程化与可观测性intermediate

Token 统计与成本控制

介绍 Token 成本来源、每日额度控制、RAG 上下文压缩和模型调用降级策略。

Token 成本控制用户额度限流

AI Agent 应用后端工程能力intermediate

Java 主服务与 Python AI 服务架构

介绍 Java 业务主服务与 Python AI 服务拆分的原因、接口边界和落地方式。

Java Python FastAPI Spring Boot

AI Agent 应用后端工程能力intermediate

Java SSE 转发实战

介绍 Java API 如何转发 AI Service 的 SSE 流，并处理登录、额度、错误和浏览器断开。

Java SSE Spring Boot 流式输出

AI Agent 应用基础beginner

AI Agent 应用是什么

解释 AI Agent 应用要解决的问题、能力边界，以及它和模型研发、传统业务系统的关系。

AIAgent AI Agent应用能力边界 Agent系统

AI Agent 应用基础beginner

AI Agent 应用开发和模型研发的边界

对比 AI Agent 应用开发与模型研发的目标、交付物、技术栈和协作边界。

AIAgent AI Agent应用模型研发能力边界

AI Agent 应用基础beginner

如何把业务需求拆成 AI 能力

说明如何从业务目标出发，判断一个 AI Agent 应用需要模型、RAG、工具调用、状态管理还是工程治理。

需求拆解 AIAgent AI Agent应用能力边界

AI Agent 应用基础intermediate

AI Agent 应用能力如何分层

从功能实现、模块交付、系统治理三个层次，解释 AI Agent 应用能力如何逐步提升。

AIAgent AI Agent应用能力分层工程治理

AI Agent 应用基础beginner

常见 AI Agent 应用场景

梳理知识库问答、内容生成、流程自动化和内部 Copilot 等常见 AI Agent 应用场景，说明它们对应的核心技术模块。

AIAgent AI Agent应用 RAG Agent

AI Agent 应用基础intermediate

企业级 AI Agent 系统典型架构

说明企业级 AI Agent 系统的典型模块组成、服务边界和数据流，帮助学习者建立整体架构视角。

企业架构 AIAgent AI Agent应用系统设计

Guidebeginner

知识库

Way To Agent 知识库入口，按 AI Agent、RAG、Prompt、工具调用与工程化主题组织内容。

文档站学习路径

LangChain / LangGraph 实战beginner

LangChain 总览

介绍 LangChain 的核心抽象、适合场景和在 AI 应用工程中的边界。

LangChain Retriever Tool Chain

LangChain / LangGraph 实战beginner

LangGraph 总览

介绍 LangGraph 的 StateGraph、节点、边和条件分支，以及它适合多步骤 Agent 的原因。

LangGraph StateGraph Agent 状态流转

Prompt Engineeringbeginner

Prompt Engineering 是什么

解释 Prompt Engineering 在工程系统中的职责，从写提示词升级到模板、版本、评估和安全管理。

Prompt System Prompt Few-shot 结构化输出

Prompt Engineeringintermediate

RAG 问答 Prompt 设计

介绍 RAG Prompt 如何约束模型只基于上下文回答、如何处理不确定性，以及如何输出可追溯引用。

RAG Prompt 引用溯源忠实度

RAG 知识库工程beginner

RAG 是什么

解释 RAG 解决的问题、与普通搜索和微调的区别，以及为什么它是 AI 应用工程中的核心能力。

RAG 知识库检索增强生成

RAG 知识库工程intermediate

RAG 系统架构

拆解 RAG 从内容源到回答生成的服务边界、数据流和关键表设计。

RAG 系统架构 Qdrant PostgreSQL

RAG 知识库工程intermediate

RAG 文档解析

介绍 Markdown / MDX 文档解析、frontmatter 提取、正文清洗和结构化元数据在 RAG 中的作用。

文档解析 Markdown MDX frontmatter

RAG 知识库工程intermediate

RAG 切片策略

介绍固定长度切片、标题感知切片、语义切片、chunk_size 和 overlap 的工程取舍。

Chunk 标题感知切片 Overlap Markdown

RAG 知识库工程intermediate

Embedding 工程入门

介绍 Embedding 在 RAG 中的作用、向量维度、批量生成、模型替换和失败重试。

Embedding 向量批量处理模型配置

RAG 知识库工程intermediate

向量数据库在 RAG 中的作用

解释向量数据库为什么需要保存向量和 payload，以及它与 PostgreSQL、文档站搜索的边界。

向量数据库 Qdrant Collection Payload

RAG 知识库工程intermediate

混合检索是什么

解释向量检索、关键词检索和混合检索的关系，以及中小型知识库系统通常为何区分公开搜索和 RAG 语义检索。

混合检索向量检索 BM25 Orama

RAG 知识库工程intermediate

Rerank 为什么重要

介绍 Rerank 在 RAG 中的作用、与向量召回的关系，以及如何记录和使用 rerank_score。

Rerank Cross Encoder TopK 检索质量

RAG 知识库工程intermediate

RAG 引用溯源设计

介绍 RAG 回答为什么必须保留引用来源，以及 source_url、heading_path、chunk_id 的设计方法。

引用溯源 source_url heading_path chunk_id

RAG 知识库工程intermediate

RAG 效果评估

介绍 RAG 系统如何评估检索命中、引用准确性、回答忠实度和用户反馈。

RAG评估召回率忠实度用户反馈