进阶10 篇文章·约 2 小时 13 分钟

工程师AI转型实战

为有编程经验的工程师设计的LLM实战学习路径。从会用API到能训练模型,10篇文章覆盖Transformer、训练全流程、RAG、LoRA微调、Agent开发、模型部署和评测。

开始学习
学习进度0 / 10 已完成

一步一个脚印,坚持学完你就是下一个大模型专家

课程章节

1
LLM工程师学习路线图:从程序员到AI工程师的完整路径免费

三个月前,一个做了五年Java后端的读者给我留言: 这三个问题——从哪学起、学完能做什么、能找到工作吗——几乎是所有转行工程师的共同困惑。 比起学什么,更紧迫的问题是:学完之后,你到底能应聘什么岗位? 2026年的LLM岗位已经高度分化。同样是"搞AI的",Prompt工程师的日常工作跟模型训练工程师的日常工作,重合度不到20%。如果你不知道这些岗位的区别,你很可能会花几个月学了用不上的东西。 根...

入门12 分钟阅读
2
Transformer架构:工程师视角的核心理解免费

先说一个可能会让你意外的观点:你做LLM应用开发,不需要精通Transformer的数学推导。 但你至少要理解到"能看懂,不稀里糊涂"的程度。为什么? 因为当你做本专题后面几件事的时候,你会反复撞上Transformer的概念: - 你做LoRA微调时,要选择targetmodules——这些"modules"就是Transformer里的Q、K、V投影层。如果你不知道QKV是什么,你就是在蒙。 ...

入门20 分钟阅读
3
大模型训练全流程:CPT→SFT→RLHF免费

先说一个场景。 你的团队用 Qwen2.5-7B 做了一个客服机器人。上线两周后,产品经理跑过来说:「用户反馈机器人回答太生硬了,能不能让它用更亲切的语气?」你看了下代码——你只是在调 API,你没改过模型。 这时候你会怎么办?如果你对训练流程一无所知,你的选项只有一个:改 Prompt,加一句「请用亲切的语气回答」。效果好不好全靠运气。 但如果你理解本章的内容,你会立刻判断出:这是 SFT (有...

进阶17 分钟阅读
4
Tokenization深入浅出:大模型是怎么"看懂"你写的话的免费

打开 DeepSeek,你在对话框敲下: 敲回车,几秒钟后,一大段文字出现在屏幕上。这个体验太流畅了,让你觉得模型就是"读懂了你的话"。 但模型从来没有"读"过这句话。模型不认识汉字。 你打下的 8 个汉字,在进入模型之前,变成了一串数字。比如: "帮我写一份周报。" ↓ 31126, 45169, 46434, 54631, 26253, 11187, 10848, 32285, 2...

进阶16 分钟阅读
5
Prompt Engineering方法论:从会用API到会设计Prompt免费

几乎每个月都有文章说「Prompt Engineering 要死了,因为模型越来越聪明,你随便说一句话它都能懂。」 但实际干活的时候你会发现——不是那么回事。 你做了一个客服机器人,用户问「怎么退货」。你写的 Prompt 是「你是一个客服助手,请回答用户的问题」。模型有时候回答得像个客服,有时候突然写起了退货教程小说。产品经理说「能不能让格式稳定一点?」 你追问两句,发现根本不是模型不够聪明,是...

进阶17 分钟阅读
6
从零搭建RAG问答系统:含完整代码免费

你有没有遇到过这个场景:你公司有一个 100 页的产品手册 PDF,客服同事每天被客户反复问同样的问题。你想做一个机器人,让客户自己问、自己得到答案。 你试了直接问大模型。模型答得头头是道——但内容跟你们公司的产品手册完全对不上。因为模型没见过你们公司的文档。 你也试了把 PDF 全文粘贴进 Prompt。模型说"输入太长了"。 这就是 RAG(Retrieval-Augmented Genera...

进阶11 分钟阅读
7
LoRA微调实战:100条数据微调你的模型免费

第六篇你搭了一个 RAG 系统——用户问什么,模型去翻你的文档,找到相关内容再回答。信息准确,效果不错。 但两周后,产品经理提了新需求:「能不能让这个客服机器人的语气更像我们自己品牌的风格?不要那种一本正经的AI味,要亲切一点。」 你试了 Prompt——改 System Prompt,加角色设定,加 Few-shot 范例。效果有,但不稳定。同一套 Prompt,有的问题回答很亲切,有的问题又变...

高级11 分钟阅读
8
Agent开发实战:让LLM调用工具和API免费

你做了一个 RAG 系统(第 6 篇),用户问"帮我查一下最新的 AI 招聘数据,然后整理成邮件发给我"。你的 RAG 系统能查文档——但不能上网搜最新数据,也不能发邮件。 这就是 Agent 要解决的问题:模型不只是"回答问题",而是"自主规划+调用工具+多步执行"。 RAG 是"查资料→生成答案",Agent 是"思考要做什么→选一个工具→执行→拿到结果→继续思考→...→完成任务"。后者是前...

高级10 分钟阅读
9
模型部署与服务化:vLLM实战免费

第 7 篇你微调好了模型,兴冲冲写了一段推理代码: python from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.frompretrained"./qwen-lora-cs".to"cuda" tokenizer = AutoTokenizer.frompretrai...

进阶8 分钟阅读
10
LLM应用评测体系:如何量化你的应用效果免费

你微调好了模型、搭好了 RAG、Agent 跑起来了。产品经理问你:"这个系统效果怎么样?"你说:"我觉得还行。" "还行"不是答案。 你改了一个 Prompt,想上线。你说"我感觉新 Prompt 比旧的好"。——"感觉"也不是答案。 2026 年 OpenAI 的研究有个数据值得反复看:同等模型能力下,经过系统化 Prompt 优化的 Agent 任务完成率可达 92%,而未经优化的只有 53...

高级11 分钟阅读

继续探索其他学习路线