预训练
预训练是 LLM 能力形成的基石阶段。作为自监督学习在海量无标注文本上的规模化实践,预训练通过训练目标 Next Token Prediction 将分布式语义知识压缩至模型参数中,构成后续监督微调(SFT)与强化学习(RL)对齐阶段的初始化基础。
1
2
3
4
5
参考
Last updated
预训练是 LLM 能力形成的基石阶段。作为自监督学习在海量无标注文本上的规模化实践,预训练通过训练目标 Next Token Prediction 将分布式语义知识压缩至模型参数中,构成后续监督微调(SFT)与强化学习(RL)对齐阶段的初始化基础。
Last updated