AI知识中心 / 学习路线 / LLM 训练与微调 / 大模型预训练全景解读
📚LLM 训练与微调·1/4
25% 完成
📖 教程进阶⏱️ 18 分钟

大模型预训练全景解读

📅 2026/5/14✍️ 佚名💬 0 条评论

预训练的目标


在海量无标注数据上学习通用语言知识和世界知识。


数据来源:Common Crawl、Wikipedia、GitHub、学术论文


分布式训练:DP · MP · PP · ZeRO


当前主流模型通常使用 2-15T tokens 进行预训练。

评论 (0)

请先登录后发表评论

暂无评论,来发表第一条评论吧