大模型应用基础概念
介绍 AI 应用开发中必须理解的 Token、上下文窗口、模型参数、System Prompt 和输出不确定性。
第一阶段使用本地内容索引检索标题、摘要、分类和标签,不依赖 arbor-api 或模型调用。
介绍 AI 应用开发中必须理解的 Token、上下文窗口、模型参数、System Prompt 和输出不确定性。
说明在 AI 应用工程里如何选择模型、调节参数和控制输出边界,以及什么时候不该走微调路线。
介绍大模型流式输出的价值、SSE 事件设计、Java 转发和前端展示边界。
介绍 Way To Agent 的定位、知识图谱和阅读方式,说明它如何围绕 AI Agent 构建系统化知识库。
解释 AI Agent 的定义、组成和边界,为后续 RAG、工具调用、记忆、规划和编排知识建立主线。
介绍 Fumadocs / Orama / 本地 search-index.json 在公开文档站中的作用,以及它与 RAG 语义检索的边界。
介绍 Qdrant 的 Collection、Point、Vector、Payload 和过滤查询,以及它在中小型知识库系统 RAG 中的职责。
系统拆解自建 RAG 服务的检索层选型逻辑,解释文档站搜索、语义检索、向量数据库和全文检索的边界,并说明中小型知识库系统为什么采用 Fumadocs / Orama + Qdrant 的组合。
解释 Agent 与 Chatbot、LLM、Workflow 的区别,以及任务、工具、状态和安全边界。
介绍工具调用的基本流程、参数 Schema、服务端校验、失败处理和调用日志。
介绍 AI Agent 应用从 Demo 走向生产系统需要补齐的日志、评估、监控、成本、安全和降级能力。
介绍 AI 调用日志应记录哪些字段,如何支撑额度扣减、故障排查、质量评估和审计。
介绍 Token 成本来源、每日额度控制、RAG 上下文压缩和模型调用降级策略。
介绍 Java 业务主服务与 Python AI 服务拆分的原因、接口边界和落地方式。
介绍 Java API 如何转发 AI Service 的 SSE 流,并处理登录、额度、错误和浏览器断开。
解释 AI Agent 应用要解决的问题、能力边界,以及它和模型研发、传统业务系统的关系。
对比 AI Agent 应用开发与模型研发的目标、交付物、技术栈和协作边界。
说明如何从业务目标出发,判断一个 AI Agent 应用需要模型、RAG、工具调用、状态管理还是工程治理。
从功能实现、模块交付、系统治理三个层次,解释 AI Agent 应用能力如何逐步提升。
梳理知识库问答、内容生成、流程自动化和内部 Copilot 等常见 AI Agent 应用场景,说明它们对应的核心技术模块。
说明企业级 AI Agent 系统的典型模块组成、服务边界和数据流,帮助学习者建立整体架构视角。
Way To Agent 知识库入口,按 AI Agent、RAG、Prompt、工具调用与工程化主题组织内容。
介绍 LangChain 的核心抽象、适合场景和在 AI 应用工程中的边界。
介绍 LangGraph 的 StateGraph、节点、边和条件分支,以及它适合多步骤 Agent 的原因。
解释 Prompt Engineering 在工程系统中的职责,从写提示词升级到模板、版本、评估和安全管理。
介绍 RAG Prompt 如何约束模型只基于上下文回答、如何处理不确定性,以及如何输出可追溯引用。
解释 RAG 解决的问题、与普通搜索和微调的区别,以及为什么它是 AI 应用工程中的核心能力。
拆解 RAG 从内容源到回答生成的服务边界、数据流和关键表设计。
介绍 Markdown / MDX 文档解析、frontmatter 提取、正文清洗和结构化元数据在 RAG 中的作用。
介绍固定长度切片、标题感知切片、语义切片、chunk_size 和 overlap 的工程取舍。
介绍 Embedding 在 RAG 中的作用、向量维度、批量生成、模型替换和失败重试。
解释向量数据库为什么需要保存向量和 payload,以及它与 PostgreSQL、文档站搜索的边界。
解释向量检索、关键词检索和混合检索的关系,以及 中小型知识库系统通常为何区分公开搜索和 RAG 语义检索。
介绍 Rerank 在 RAG 中的作用、与向量召回的关系,以及如何记录和使用 rerank_score。
介绍 RAG 回答为什么必须保留引用来源,以及 source_url、heading_path、chunk_id 的设计方法。
介绍 RAG 系统如何评估检索命中、引用准确性、回答忠实度和用户反馈。