LLM 系列 (七):后训练与对齐:从续写器到协作者
如果说预训练回答的是“大模型的通用能力从哪里来”,那么后训练回答的就是另一个更关键的问题:这些能力如何被稳定、可靠、可控地组织成用户真正可用的行为。
预训练后的 Base Model 已经学到了大量语言、知识、代码、数学和推理模式,但它本质上仍然是一个基于上下文预测下一个 token 的生成模型。它可以续写论文、代码、对话和网页,也可能生成看似合理但不一定真实、安全或符合用户意图的内容。换句话说,Base Model 拥有能力,但还没有被塑造成一个“助手”:它不天然知道什么叫听指令,什么叫有帮助,什么时候应该拒绝,什么时候应该承认不确定,什么时候应该调用工具完成任务。