大模型应用基础概念

介绍 AI 应用开发中必须理解的 Token、上下文窗口、模型参数、System Prompt 和输出不确定性。

大模型应用的基础概念，看起来像一堆术语，实际上都在解释同一件事：为什么模型调用不像普通 API 那样稳定。Token、上下文窗口、System Prompt、Temperature 这些词，如果只停留在定义层，你很难真正理解它们为什么会影响成本、输出质量和系统设计。

这篇文章的目标不是讲模型内部原理，而是帮你建立应用视角。

Token 不只是计费单位

很多人第一次接触 Token，只记住它和价格有关。其实它至少同时影响三件事：

所以 Token 不是财务问题，它同时还是产品和工程问题。

模型再强，看不见的信息也用不上。上下文窗口决定了一次请求里能放下多少历史消息、检索片段、系统约束和输出格式要求。

这会直接影响：

窗口不够大时，问题不只是“内容放不下”，还会逼你做更严格的取舍。

这两个层次经常被混写，后面就会越来越乱。更稳的理解是：

把它们分开，不只是写得更整齐，而是后面更容易做版本管理、评估和审计。

Temperature、最大输出长度、停止条件这些参数，看起来像模型侧细节，实际上会反过来影响系统行为。

所以参数不是随手一调的“小旋钮”，而是系统边界的一部分。

基础概念的价值，不是记住定义，而是理解模型调用为什么天生带着成本、不确定性和边界约束。