进阶10 篇文章·约 2 小时 13 分钟

工程师AI转型实战

为有编程经验的工程师设计的LLM实战学习路径。从会用API到能训练模型，10篇文章覆盖Transformer、训练全流程、RAG、LoRA微调、Agent开发、模型部署和评测。

学习进度0 / 10 已完成

一步一个脚印，坚持学完你就是下一个大模型专家

课程章节

三个月前，一个做了五年Java后端的读者给我留言：这三个问题——从哪学起、学完能做什么、能找到工作吗——几乎是所有转行工程师的共同困惑。比起学什么，更紧迫的问题是：学完之后，你到底能应聘什么岗位？ 2026年的LLM岗位已经高度分化。同样是"搞AI的"，Prompt工程师的日常工作跟模型训练工程师的日常工作，重合度不到20%。如果你不知道这些岗位的区别，你很可能会花几个月学了用不上的东西。根...

入门12 分钟阅读

Transformer架构：工程师视角的核心理解免费

先说一个可能会让你意外的观点：你做LLM应用开发，不需要精通Transformer的数学推导。但你至少要理解到"能看懂，不稀里糊涂"的程度。为什么？因为当你做本专题后面几件事的时候，你会反复撞上Transformer的概念： - 你做LoRA微调时，要选择targetmodules——这些"modules"就是Transformer里的Q、K、V投影层。如果你不知道QKV是什么，你就是在蒙。 ...

入门20 分钟阅读

大模型训练全流程：CPT→SFT→RLHF免费

先说一个场景。你的团队用 Qwen2.5-7B 做了一个客服机器人。上线两周后，产品经理跑过来说：「用户反馈机器人回答太生硬了，能不能让它用更亲切的语气？」你看了下代码——你只是在调 API，你没改过模型。这时候你会怎么办？如果你对训练流程一无所知，你的选项只有一个：改 Prompt，加一句「请用亲切的语气回答」。效果好不好全靠运气。但如果你理解本章的内容，你会立刻判断出：这是 SFT （有...

进阶17 分钟阅读

Tokenization深入浅出：大模型是怎么"看懂"你写的话的免费

打开 DeepSeek，你在对话框敲下：敲回车，几秒钟后，一大段文字出现在屏幕上。这个体验太流畅了，让你觉得模型就是"读懂了你的话"。但模型从来没有"读"过这句话。模型不认识汉字。你打下的 8 个汉字，在进入模型之前，变成了一串数字。比如： "帮我写一份周报。" ↓ 31126, 45169, 46434, 54631, 26253, 11187, 10848, 32285, 2...

进阶16 分钟阅读

Prompt Engineering方法论：从会用API到会设计Prompt免费

几乎每个月都有文章说「Prompt Engineering 要死了，因为模型越来越聪明，你随便说一句话它都能懂。」但实际干活的时候你会发现——不是那么回事。你做了一个客服机器人，用户问「怎么退货」。你写的 Prompt 是「你是一个客服助手，请回答用户的问题」。模型有时候回答得像个客服，有时候突然写起了退货教程小说。产品经理说「能不能让格式稳定一点？」你追问两句，发现根本不是模型不够聪明，是...

进阶17 分钟阅读

从零搭建RAG问答系统：含完整代码免费

你有没有遇到过这个场景：你公司有一个 100 页的产品手册 PDF，客服同事每天被客户反复问同样的问题。你想做一个机器人，让客户自己问、自己得到答案。你试了直接问大模型。模型答得头头是道——但内容跟你们公司的产品手册完全对不上。因为模型没见过你们公司的文档。你也试了把 PDF 全文粘贴进 Prompt。模型说"输入太长了"。这就是 RAG（Retrieval-Augmented Genera...

进阶11 分钟阅读

LoRA微调实战：100条数据微调你的模型免费

第六篇你搭了一个 RAG 系统——用户问什么，模型去翻你的文档，找到相关内容再回答。信息准确，效果不错。但两周后，产品经理提了新需求：「能不能让这个客服机器人的语气更像我们自己品牌的风格？不要那种一本正经的AI味，要亲切一点。」你试了 Prompt——改 System Prompt，加角色设定，加 Few-shot 范例。效果有，但不稳定。同一套 Prompt，有的问题回答很亲切，有的问题又变...

高级11 分钟阅读

Agent开发实战：让LLM调用工具和API免费

你做了一个 RAG 系统（第 6 篇），用户问"帮我查一下最新的 AI 招聘数据，然后整理成邮件发给我"。你的 RAG 系统能查文档——但不能上网搜最新数据，也不能发邮件。这就是 Agent 要解决的问题：模型不只是"回答问题"，而是"自主规划+调用工具+多步执行"。 RAG 是"查资料→生成答案"，Agent 是"思考要做什么→选一个工具→执行→拿到结果→继续思考→...→完成任务"。后者是前...

高级10 分钟阅读

模型部署与服务化：vLLM实战免费

第 7 篇你微调好了模型，兴冲冲写了一段推理代码： python from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.frompretrained"./qwen-lora-cs".to"cuda" tokenizer = AutoTokenizer.frompretrai...

进阶8 分钟阅读

LLM应用评测体系：如何量化你的应用效果免费

你微调好了模型、搭好了 RAG、Agent 跑起来了。产品经理问你："这个系统效果怎么样？"你说："我觉得还行。" "还行"不是答案。你改了一个 Prompt，想上线。你说"我感觉新 Prompt 比旧的好"。——"感觉"也不是答案。 2026 年 OpenAI 的研究有个数据值得反复看：同等模型能力下，经过系统化 Prompt 优化的 Agent 任务完成率可达 92%，而未经优化的只有 53...

高级11 分钟阅读

继续探索其他学习路线

LLM进阶：从会用到底层精通

高级

专为AI从业者设计的高阶LLM技术教程，从Transformer数学本质到2026前沿趋势，构建完整的底层精通能力

大模型零基础入门

入门

专为零基础用户设计——不懂编程、不懂数学也能学会用AI。8篇文章带你从了解大模型是什么到能用AI搞定日常工作。

如何把 AI 用得更好

入门

一本写给所有人的「AI 使用心法」，从搞懂 AI 怎么想开始，到能搭建自动化工作流，最终成为能理性驾驭 AI 的高手。不需要编程基础，只需会打字。

人工智能零基础入门 — 从完全不懂到能跟 AI 做朋友

入门

面向完全零基础、没有任何技术背景的普通人，用最通俗的语言讲清楚人工智能到底是什么，核心聚焦于大模型技术。读完整个专题后，你能自信地说「我懂 AI 了」。