工程师AI转型实战
为有编程经验的工程师设计的LLM实战学习路径。从会用API到能训练模型,10篇文章覆盖Transformer、训练全流程、RAG、LoRA微调、Agent开发、模型部署和评测。
开始学习一步一个脚印,坚持学完你就是下一个大模型专家
课程章节
三个月前,一个做了五年Java后端的读者给我留言: 这三个问题——从哪学起、学完能做什么、能找到工作吗——几乎是所有转行工程师的共同困惑。 比起学什么,更紧迫的问题是:学完之后,你到底能应聘什么岗位? 2026年的LLM岗位已经高度分化。同样是"搞AI的",Prompt工程师的日常工作跟模型训练工程师的日常工作,重合度不到20%。如果你不知道这些岗位的区别,你很可能会花几个月学了用不上的东西。 根...
先说一个可能会让你意外的观点:你做LLM应用开发,不需要精通Transformer的数学推导。 但你至少要理解到"能看懂,不稀里糊涂"的程度。为什么? 因为当你做本专题后面几件事的时候,你会反复撞上Transformer的概念: - 你做LoRA微调时,要选择targetmodules——这些"modules"就是Transformer里的Q、K、V投影层。如果你不知道QKV是什么,你就是在蒙。 ...
先说一个场景。 你的团队用 Qwen2.5-7B 做了一个客服机器人。上线两周后,产品经理跑过来说:「用户反馈机器人回答太生硬了,能不能让它用更亲切的语气?」你看了下代码——你只是在调 API,你没改过模型。 这时候你会怎么办?如果你对训练流程一无所知,你的选项只有一个:改 Prompt,加一句「请用亲切的语气回答」。效果好不好全靠运气。 但如果你理解本章的内容,你会立刻判断出:这是 SFT (有...
打开 DeepSeek,你在对话框敲下: 敲回车,几秒钟后,一大段文字出现在屏幕上。这个体验太流畅了,让你觉得模型就是"读懂了你的话"。 但模型从来没有"读"过这句话。模型不认识汉字。 你打下的 8 个汉字,在进入模型之前,变成了一串数字。比如: "帮我写一份周报。" ↓ 31126, 45169, 46434, 54631, 26253, 11187, 10848, 32285, 2...
几乎每个月都有文章说「Prompt Engineering 要死了,因为模型越来越聪明,你随便说一句话它都能懂。」 但实际干活的时候你会发现——不是那么回事。 你做了一个客服机器人,用户问「怎么退货」。你写的 Prompt 是「你是一个客服助手,请回答用户的问题」。模型有时候回答得像个客服,有时候突然写起了退货教程小说。产品经理说「能不能让格式稳定一点?」 你追问两句,发现根本不是模型不够聪明,是...
你有没有遇到过这个场景:你公司有一个 100 页的产品手册 PDF,客服同事每天被客户反复问同样的问题。你想做一个机器人,让客户自己问、自己得到答案。 你试了直接问大模型。模型答得头头是道——但内容跟你们公司的产品手册完全对不上。因为模型没见过你们公司的文档。 你也试了把 PDF 全文粘贴进 Prompt。模型说"输入太长了"。 这就是 RAG(Retrieval-Augmented Genera...
第六篇你搭了一个 RAG 系统——用户问什么,模型去翻你的文档,找到相关内容再回答。信息准确,效果不错。 但两周后,产品经理提了新需求:「能不能让这个客服机器人的语气更像我们自己品牌的风格?不要那种一本正经的AI味,要亲切一点。」 你试了 Prompt——改 System Prompt,加角色设定,加 Few-shot 范例。效果有,但不稳定。同一套 Prompt,有的问题回答很亲切,有的问题又变...
你做了一个 RAG 系统(第 6 篇),用户问"帮我查一下最新的 AI 招聘数据,然后整理成邮件发给我"。你的 RAG 系统能查文档——但不能上网搜最新数据,也不能发邮件。 这就是 Agent 要解决的问题:模型不只是"回答问题",而是"自主规划+调用工具+多步执行"。 RAG 是"查资料→生成答案",Agent 是"思考要做什么→选一个工具→执行→拿到结果→继续思考→...→完成任务"。后者是前...
第 7 篇你微调好了模型,兴冲冲写了一段推理代码: python from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.frompretrained"./qwen-lora-cs".to"cuda" tokenizer = AutoTokenizer.frompretrai...
你微调好了模型、搭好了 RAG、Agent 跑起来了。产品经理问你:"这个系统效果怎么样?"你说:"我觉得还行。" "还行"不是答案。 你改了一个 Prompt,想上线。你说"我感觉新 Prompt 比旧的好"。——"感觉"也不是答案。 2026 年 OpenAI 的研究有个数据值得反复看:同等模型能力下,经过系统化 Prompt 优化的 Agent 任务完成率可达 92%,而未经优化的只有 53...
继续探索其他学习路线
LLM进阶:从会用到底层精通
高级专为AI从业者设计的高阶LLM技术教程,从Transformer数学本质到2026前沿趋势,构建完整的底层精通能力
大模型零基础入门
入门专为零基础用户设计——不懂编程、不懂数学也能学会用AI。8篇文章带你从了解大模型是什么到能用AI搞定日常工作。
如何把 AI 用得更好
入门一本写给所有人的「AI 使用心法」,从搞懂 AI 怎么想开始,到能搭建自动化工作流,最终成为能理性驾驭 AI 的高手。不需要编程基础,只需会打字。
人工智能零基础入门 — 从完全不懂到能跟 AI 做朋友
入门面向完全零基础、没有任何技术背景的普通人,用最通俗的语言讲清楚人工智能到底是什么,核心聚焦于大模型技术。读完整个专题后,你能自信地说「我懂 AI 了」。