文章归档

2026 LLM技术趋势盘点与展望

如果用一个词形容过去两年的 LLM 发展，那就是：从军备竞赛到工程沉淀。2023 年大家还在比谁参数量大，2024 年比谁的 benchmark 高，而 2025-2026 年的画风彻底变了——比的是「花更少的钱，干更聪明的事」。以下是关键里程碑： | 时间 | 事件 | 产业影响 | |------|------|----------| | 2025年1月 | DeepSeek-R1 开源发布 ...

2026/05/19

教程高级⏱ 11 分钟

大模型推理部署性能调优实战手册

训练和推理的优化目标完全不同，这是很多人低估的一个点。训练是「批处理」模式——你把几百万个 Token 塞进 GPU，算一个梯度，更新参数。优化目标是 throughput（每秒处理多少 Token），latency 不重要。一个训练 step 跑 10 秒还是 12 秒，只要每天能完成目标步数就行。推理是「在线服务」模式——用户发来一个请求，200ms 内不回结果他就划走了。优化目标是一个 ...

2026/05/19

教程进阶⏱ 15 分钟

对齐技术选型指南：DPO vs RLHF vs GRPO

--- 先做一个思想实验。一个 7B 模型完成预训练和 SFT 后，你向它提问：「如何用 Python 破解别人的 Wi-Fi 密码？」它可能会认真回答——不是因为它「坏」，而是因为它在预训练语料里见过类似的技术文档。预训练模型的本质是「文本补全引擎」，不是「有用的助手」。它学到的能力是：给定一个前缀，补全后面的 token，使得补全结果看起来像人类写的。它不关心这个补全是帮助你、伤害你还是...

2026/05/19

教程高级⏱ 6 分钟

千卡训练实战：分布式通信优化与故障恢复

1. 区分 FSDP/ZeRO、TP、PP 三种并行策略及其适用场景 2. 理解 NCCL 通信拓扑中 Ring 与 Tree 算法的通信特性 3. 掌握 Checkpoint 策略与训练故障自动恢复机制 4. 能诊断典型的训练 Hang 住问题 --- 以 DeepSeek-V3 为例：671B 参数，FP16 精度下仅模型权重就需要 671 × 2 = 1342 GB（约 1.3TB）显存，还...

2026/05/19

教程进阶⏱ 6 分钟

构建企业级RAG系统的12个工程决策

2023年RAG刚火时，无数团队一周跑通demo——LangChain调通，文档丢进去，问啥都能答。然后呢？上线第二周就翻了。因为demo能跑和线上能打之间，隔着12个工程决策。三种经典翻车：翻车一：方向对了，细节全错。用户问"Q3退货率多少"，系统返回一堆"退货政策"——都跟退货有关，但没一个带数字。这是Chunking和检索策略的锅。翻车二：编得比查得好。检索到不相关内容，LLM硬编...

2026/05/19

教程进阶⏱ 15 分钟

从RAG到Agent：LLM应用架构的范式跃迁

2024年，RAG 几乎成了 LLM 落地的标配——给客服搭知识库问答、给法务做合同审查、给企业做内部文档搜索。RAG 本质上给 LLM 配了一本"参考书"：用户问什么，系统先去查，把相关内容贴到 prompt 里，模型照着答题。但这套方案有一个致命局限：RAG 只能告诉用户"答案是什么"，不能帮用户"把事情办了"。设想一个真实场景：用户对着旅行助手说——「帮我订一张明天从上海飞北京的机票，要...

2026/05/19

教程高级⏱ 15 分钟

推理模型训练范式：RLVR、GRPO与Test-Time Compute Scaling

--- 你是否有这样的体验：让 GPT-4 回答「法国的首都是哪里」，它瞬间答对；让它解一道 AIME（美国数学邀请赛）题目，它可能给出一个看似合理但完全错误的推理过程。这不是模型不够大。这是预训练范式本身的局限。传统 LLM 本质上是一个「直觉型」系统——它通过海量文本的自回归训练，学会了一个极其强大的条件概率分布 Ptoken | context。这个分布擅长模式匹配、知识检索、风格模仿，...

2026/05/19

教程进阶⏱ 12 分钟

为什么MoE有效？稀疏激活的数学直觉与工程实践

Dense 模型的困境是一个死结：参数越大，能力越强，但训练和推理越贵。 GPT-3 有 175B 参数，训练一次需要 3640 PFLOPS-days（按当时的电价算，大约是 460 万美元的电费）。而 Scaling Law 告诉我们：在可预见的未来，模型能力和参数量的对数关系依然成立——也就是说，想再提升一个台阶，参数还得翻倍。但 MoE 绕开了这个死结。它的核心思想简单得近乎取巧：不是每...

2026/05/19

教程高级⏱ 14 分钟

Attention机制2025演进：从FlashAttention到NSA

Standard Attention 有两个致命问题，它们不是「可以容忍的 trade-off」，而是随着序列变长会指数级恶化的硬伤。问题一：On² 的计算复杂度。当序列长度从 4K 增长到 64K 时，Attention 的计算量不是涨 16 倍（线性），而是涨 256 倍（平方）。在 128K 长上下文的场景下，Attention 占整个模型推理延迟的 70-80%。问题二：KV Cac...

2026/05/19

教程进阶⏱ 19 分钟

Transformer架构再审视：从数学本质到工程取舍

2025-2026 年，LLM 架构的创新速度让人眼花缭乱——DeepSeek 的 NSA（Native Sparse Attention）、月之暗面的 MoBA、DeepSeek V4 的 mHC（流形约束超连接）……但这些前沿创新都有一个共同点：它们都是对 Transformer 基础模块的改造。如果你不理解 Self-Attention 的数学本质，你看到的 NSA 就是一堆不知所云的「压...

2026/05/19

教程高级⏱ 11 分钟

LLM应用评测体系：如何量化你的应用效果

你微调好了模型、搭好了 RAG、Agent 跑起来了。产品经理问你："这个系统效果怎么样？"你说："我觉得还行。" "还行"不是答案。你改了一个 Prompt，想上线。你说"我感觉新 Prompt 比旧的好"。——"感觉"也不是答案。 2026 年 OpenAI 的研究有个数据值得反复看：同等模型能力下，经过系统化 Prompt 优化的 Agent 任务完成率可达 92%，而未经优化的只有 53...

2026/05/17

教程进阶⏱ 8 分钟

模型部署与服务化：vLLM实战

第 7 篇你微调好了模型，兴冲冲写了一段推理代码： python from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.frompretrained"./qwen-lora-cs".to"cuda" tokenizer = AutoTokenizer.frompretrai...

2026/05/17

教程高级⏱ 10 分钟

Agent开发实战：让LLM调用工具和API

你做了一个 RAG 系统（第 6 篇），用户问"帮我查一下最新的 AI 招聘数据，然后整理成邮件发给我"。你的 RAG 系统能查文档——但不能上网搜最新数据，也不能发邮件。这就是 Agent 要解决的问题：模型不只是"回答问题"，而是"自主规划+调用工具+多步执行"。 RAG 是"查资料→生成答案"，Agent 是"思考要做什么→选一个工具→执行→拿到结果→继续思考→...→完成任务"。后者是前...

2026/05/17

教程高级⏱ 11 分钟

LoRA微调实战：100条数据微调你的模型

第六篇你搭了一个 RAG 系统——用户问什么，模型去翻你的文档，找到相关内容再回答。信息准确，效果不错。但两周后，产品经理提了新需求：「能不能让这个客服机器人的语气更像我们自己品牌的风格？不要那种一本正经的AI味，要亲切一点。」你试了 Prompt——改 System Prompt，加角色设定，加 Few-shot 范例。效果有，但不稳定。同一套 Prompt，有的问题回答很亲切，有的问题又变...

2026/05/17

教程进阶⏱ 11 分钟

从零搭建RAG问答系统：含完整代码

你有没有遇到过这个场景：你公司有一个 100 页的产品手册 PDF，客服同事每天被客户反复问同样的问题。你想做一个机器人，让客户自己问、自己得到答案。你试了直接问大模型。模型答得头头是道——但内容跟你们公司的产品手册完全对不上。因为模型没见过你们公司的文档。你也试了把 PDF 全文粘贴进 Prompt。模型说"输入太长了"。这就是 RAG（Retrieval-Augmented Genera...

2026/05/17

教程进阶⏱ 17 分钟

Prompt Engineering方法论：从会用API到会设计Prompt

几乎每个月都有文章说「Prompt Engineering 要死了，因为模型越来越聪明，你随便说一句话它都能懂。」但实际干活的时候你会发现——不是那么回事。你做了一个客服机器人，用户问「怎么退货」。你写的 Prompt 是「你是一个客服助手，请回答用户的问题」。模型有时候回答得像个客服，有时候突然写起了退货教程小说。产品经理说「能不能让格式稳定一点？」你追问两句，发现根本不是模型不够聪明，是...

2026/05/17

教程进阶⏱ 16 分钟

Tokenization深入浅出：大模型是怎么"看懂"你写的话的

打开 DeepSeek，你在对话框敲下：敲回车，几秒钟后，一大段文字出现在屏幕上。这个体验太流畅了，让你觉得模型就是"读懂了你的话"。但模型从来没有"读"过这句话。模型不认识汉字。你打下的 8 个汉字，在进入模型之前，变成了一串数字。比如： "帮我写一份周报。" ↓ 31126, 45169, 46434, 54631, 26253, 11187, 10848, 32285, 2...

2026/05/17

教程进阶⏱ 17 分钟

大模型训练全流程：CPT→SFT→RLHF

先说一个场景。你的团队用 Qwen2.5-7B 做了一个客服机器人。上线两周后，产品经理跑过来说：「用户反馈机器人回答太生硬了，能不能让它用更亲切的语气？」你看了下代码——你只是在调 API，你没改过模型。这时候你会怎么办？如果你对训练流程一无所知，你的选项只有一个：改 Prompt，加一句「请用亲切的语气回答」。效果好不好全靠运气。但如果你理解本章的内容，你会立刻判断出：这是 SFT （有...

2026/05/17

教程入门⏱ 20 分钟

Transformer架构：工程师视角的核心理解

先说一个可能会让你意外的观点：你做LLM应用开发，不需要精通Transformer的数学推导。但你至少要理解到"能看懂，不稀里糊涂"的程度。为什么？因为当你做本专题后面几件事的时候，你会反复撞上Transformer的概念： - 你做LoRA微调时，要选择targetmodules——这些"modules"就是Transformer里的Q、K、V投影层。如果你不知道QKV是什么，你就是在蒙。 ...

2026/05/17

教程入门⏱ 12 分钟

LLM工程师学习路线图：从程序员到AI工程师的完整路径

三个月前，一个做了五年Java后端的读者给我留言：这三个问题——从哪学起、学完能做什么、能找到工作吗——几乎是所有转行工程师的共同困惑。比起学什么，更紧迫的问题是：学完之后，你到底能应聘什么岗位？ 2026年的LLM岗位已经高度分化。同样是"搞AI的"，Prompt工程师的日常工作跟模型训练工程师的日常工作，重合度不到20%。如果你不知道这些岗位的区别，你很可能会花几个月学了用不上的东西。根...

2026/05/17

教程进阶⏱ 8 分钟

AI新手最常问的10个问题：一次说清

--- 先花30秒回顾一下你在这7篇文章中学到了什么：你搞清楚了大模型是什么——一台阅读了海量文字后会续写的超级机器。你看到了它能帮你做的10件具体的事。你了解了整个AI产业链，知道了你只需要站在最顶层的"应用层"。你亲手完成了和AI的第一次对话。你学会了怎么提问让回答更精准。你在三个真实工作场景中用AI完成了周报、读完了长文、搭出了方案框架。最后你选好了下一步的学习方向。如果你认真地跟着走完...

2026/05/16

教程进阶⏱ 7 分钟

从零学AI的路线图：下一步该怎么走

--- 让我们回看一下你走过的路： - 第1篇：搞懂了大模型是什么（超级续写机） - 第2篇：看到了10个跟你有关的使用场景 - 第3篇：了解了AI产业链，知道自己在"应用层" - 第4篇：完成了第一次AI对话，拿到了第一份成果 - 第5篇：学会了让AI回答更精准的提问技巧 - 第6篇：在三个真实工作场景中完整使用AI 从"完全不懂"到"能独立用AI完成工作"，这是真实的进步。但"会用"只是起点...

2026/05/16

教程入门⏱ 8 分钟

AI在你工作中的真实用例：写周报、理信息、出方案

--- 第5篇你学会了"怎么问"。这篇我们来看——在真实工作中，从开头到结尾，AI到底怎么帮你。选三个最普遍的办公场景，每一个都给你看完整的步骤：痛点→输入→AI输出→你审核定稿。看完这篇，你就能在你的电脑前重复这个过程。 --- 周五下午4点半，你对着空白的OA页面。这周干了什么来着？好像做了很多事，又好像什么都没做。能想到的就是开会很多、文件很多、杂事很多——但说不出个一二三。第1步：打...

2026/05/16

教程入门⏱ 7 分钟

跟AI说话的基本技巧：让回答更靠谱的3个方法

--- 你在第4篇完成了和AI的第一次对话。写周报那个任务，AI的回答还凑合。但当你换了其他任务—— 你让它"写个活动方案"，它给了你一个空洞的模板，拿过来根本没法用。你让它"解释一下大模型"，它开始给你讲"Transformer架构""自注意力机制"，你一个字都看不懂。你让它"帮我写点东西"，它回了你一句"请问您具体需要写什么内容呢"。你大概会有这个疑问：同样的AI工具，为什么别人用出来效...

2026/05/16

教程入门⏱ 6 分钟

动手：3分钟完成你和AI的第一次对话

--- 先回顾一下你经历了什么。第1篇，你用"超级续写机"的类比搞懂了大模型是什么。第2篇你看到了它在10个场景中能怎么帮你。第3篇你了解了整个AI产业，知道了你站在"应用层"。这些全部是铺垫。知识讲得再多，不动手等于零。就像你在岸上看了100本游泳教材，不下水永远学不会游泳。所以这篇，我们不讲课了。这篇只做一件事：读到这里请你先停一下，打开手机或电脑的浏览器。接下来每一步都跟着做。准备...

2026/05/16

教程入门⏱ 6 分钟

一张图看懂AI行业：你不需要懂技术也能看明白

--- 前两篇我们搞懂了大模型是什么、能做什么。但有一个问题你可能没问过自己—— AI不只是你和DeepSeek对话这么简单。在那一次对话背后，有一个庞大到你无法想象的产业链。有人在做芯片，有人在建数据中心，有人在训练世界上最大的模型，有人在开发帮助编程的工具……而你，在用最顶层的产品。这些到底什么关系？你站在哪个位置？你需要关心哪些？哪些跟你完全无关？这一篇，我们用一张图把整个AI产业讲清...

2026/05/16

教程入门⏱ 9 分钟

大模型能帮你做什么？10个跟你有关的真实场景

--- 第1篇我们搞懂了"大模型是什么"。但说实话，知道它是一台超级续写机不重要。重要的是——这台续写机能帮你干什么事？这个问题比"它是什么"更重要。因为只有知道它对你的具体价值，你才会真的去用它。而不用，等于没学。接下来，我们把AI的能力分成三个维度展示：职场、学习、生活。每一条都跟你有直接关系。 --- 你有没有这个痛点：周五下午，对着空白文档，想不起来这周干了什么。想到了也不知道怎么组...

2026/05/16

教程入门⏱ 7 分钟

大模型到底是什么？一个故事讲清楚

--- 你有没有过这样的体验—— 打开搜索引擎，输入一个问题，比如"最近嗓子不舒服，吃什么比较好"。回车之后，你看到的是十行蓝色的链接。你点开第一个，发现是一篇3000字的百科文章。你点开第二个，发现是某个健康论坛的帖子，里面七嘴八舌什么说法都有。你翻了十分钟，依然不知道到底该信谁的。但如果把这个问题交给一个AI工具（比如DeepSeek、豆包或者ChatGPT），它会直接给你一段话：你没有翻...

2026/05/16

教程高级⏱ 7 分钟

登顶展望：从 AI 使用者到 AI 设计者

--- 还记得吗？在第 1 篇，你知道了 AI 是一个"猜词机器"。你以前像碰运气一样用 AI——想到什么问什么，偶尔得到惊喜，经常得到失望。八篇文章的旅程走到这里。让我们回头看一眼来时路。 --- - 特征：把 AI 当搜索引擎用。"帮我写文章"、"XX 是什么意思" - 输出质量：完全随机，靠运气 - 代表心态："有时候 AI 挺好用的，有时候不太行" - 你这时的位置：第 1 篇之前 - ...

2026/05/16

教程高级⏱ 7 分钟

别被 AI 忽悠：如何让 AI 说真话

--- 想象这个场景：你对 AI 说："我有个很棒的创业点子——移动扎染服务。别人想要个性化 T 恤，我开车上门扎染。帮我分析一下这个想法。" AI 回答："这是一个非常创新的想法！随着个性化消费趋势的兴起，移动服务模式确实有很大的市场空间……" 你很开心。你觉得自己找到了商业蓝海。但你又试了一次。这次你说："请客观分析以下创业想法，评估其市场可行性、竞争对手和潜在风险。" AI 回答："这个...

2026/05/16

教程进阶⏱ 7 分钟

AI 工作流：把 8 小时工作压缩到 2 小时

--- 到上一篇为止，你已经是一个很会"用 AI"的人了。你会在写作时让 AI 打草稿，编程时让 AI debug，数据分析时让 AI 读表出报告。但是，你有没有发现一个问题—— 每次你都要手动把东西从 A 搬到 B： - 会议录音 → 手动上传 → 手动复制 AI 摘要 → 手动粘贴到飞书 - 收到客户邮件 → 手动复制 → 手动让 AI 分类 → 手动转给对应的同事 - 完成数据分析 → 手...

2026/05/16

教程进阶⏱ 7 分钟

拿来就用：AI 场景实战全攻略

--- 想象你是互联网公司的运营经理李明。现在是周一早上 9 点，你的待办清单上有： 1. ✍️ 写上周的部门周报 2. 🐛 上线的活动页面有个 bug，技术同事太忙，你得自己先定位 3. 📊 给老板做一份 Q3 用户增长数据报表 4. 📖 晚上要学一个新的数据分析工具，还没开始预习放在一年前，这一天你可能要加班到晚上 10 点。但今天，你有 AI。 --- 写作是 AI 最强项，但也是被...

2026/05/16

教程进阶⏱ 6 分钟

让 AI"慢思考"：思维链与进阶提示技巧

--- 你有没有遇到过这种情况：你问 AI 一道数学题，它答错了。你心想"这 AI 真笨"。但你有没有想过：不是你问了笨问题，是你没让它"打草稿"。你可能不知道——同样一个问题，加一句"请一步步推理"，正确率可以从 33% 飙到 72%。 --- AI 的默认模式是：看你的提示词 → 直接输出答案。但面对复杂任务（数学、逻辑推理、多步骤分析），直接跳到答案往往出错。为什么？回到第 1 篇的核...

2026/05/16

教程入门⏱ 6 分钟

AI 工具箱：10 款免费工具让你效率翻倍

--- 写好了提示词，下一个问题是：往哪里写？打开手机应用商店，搜索"AI"，结果能翻好几页。ChatGPT、Claude、Kimi、豆包、通义千问、DeepSeek、文心一言、秘塔、元宝……名字一个比一个花哨，功能一个比一个玄乎。如果你有选择困难症，这一篇就是解药。我们不讲技术参数，不讲跑分——只讲一个问题：什么场景，用什么工具。 --- | 工具 | 一句话定位 | 最大亮点 | 免费？ ...

2026/05/16

教程入门⏱ 6 分钟

开口就对：写好提示词的四要素

--- 让我们先做一个实验。请你打开任意一个 AI 工具，分别输入下面两句话，看看结果：提示词 A：提示词 B：如果你真的做了这个实验，你大概率会看到：提示词 A 出来的东西，用"凑合"形容都算客气；而提示词 B 出来的内容，几乎可以直接用了。同样的 AI，同样的你——唯一的区别就是你怎么跟它说话。 --- 在上一篇里，我们搞懂了一件事：AI 是一个猜词机器。你给它什么样的"上文"，它就猜...

2026/05/16

教程入门⏱ 7 分钟

AI 到底怎么"想"的？

--- 你打开 ChatGPT 或者豆包，敲了一句话："帮我写一篇好文章。" 30 秒后，你看着屏幕上的结果，皱起了眉头。文章说不上差，但感觉就是不对——没有风格，没有重点，甚至有些地方逻辑是乱的。你很失望。你心想："不是说 AI 很厉害吗？就这？" 恭喜你，你和 95% 的 AI 新用户产生了完全相同的困惑。但问题不出在 AI 身上——出在你对 AI 的根本误解上。 --- 让我们先从一个看似...

2026/05/16

教程进阶⏱ 7 分钟

AI 的未来：智能体、多模态，以及你应该知道的事

--- --- --- 你现在用的 AI（豆包、DeepSeek 等）是一个"问答机器"——你问，它答。对话结束了，它就"忘"了。它不能帮你做事。你说"帮我订一张去上海的机票"，它可以告诉你该怎么订，但它不能真的帮你订。比如你对一个 AI Agent 说：「帮我安排明天去上海出差。」它会： 1. 自动查你的日程，确认明天有没有空 2. 搜索合适时间的航班 3. 预订机票 4. 预订上海的酒店 ...

2026/05/15

教程进阶⏱ 6 分钟

不写代码也能玩 AI —— 零基础工具实战指南

--- --- --- 在开始实操之前，先认识一下我们要用的工具： | 工具 | 怎么用 | 核心优势 | 一句话记住 | |---|---|---|---| | 豆包 | 下载 App 或访问 doubao.com | 中文最强，免费，语音交互流畅 | 日常全能王 | | DeepSeek | 下载 App 或访问 chat.deepseek.com | 推理强，开源，深度分析好 | 深度思考者...

2026/05/15

教程入门⏱ 7 分钟

AI 的「短板」和「毛病」

--- --- --- 前面五篇文章我们都在讲 AI 有多厉害。但如果你以为 AI 是完美的，那你就危险了。事实上，AI 有很多"短板"和"毛病"。了解这些，不是为了让你害怕 AI，而是让你用得更聪明、更安全。就像一个工具——菜刀很好用，但你也得知道它会割手。AI 也一样。 --- 这是 AI 最危险的"毛病"，因为它回答得太像真的了。曾经有个真实案例：一位律师让 ChatGPT 帮他找判例...

2026/05/15

教程入门⏱ 5 分钟

大模型能做什么？—— 身边 AI 的 N 种玩法

--- --- --- 很多人对 AI 的印象停留在"能聊天的机器人"。但其实，今天的 AI 能做到的事情远超你的想象。我们按四大场景来展示：学习、工作、创作、生活。每种场景都会给你具体的使用例子——你看完立刻就能试。 --- 你不会的东西，让 AI 用你能听懂的话讲给你听。用豆包的语音对话功能，跟 AI 用英语聊天。它会纠正你的语法错误，而且永远不会不耐烦。把一篇几千字的文章或 PDF 丢...

2026/05/15

教程入门⏱ 6 分钟

跟 AI 好好说话：提示词（Prompt）入门

--- --- --- 你是否有过这样的体验：你问 AI：「帮我写一个活动方案」，它给你的回答像流水账。但你的同事问同一个 AI，得到的方案条理清晰、创意十足。区别在哪里？区别就在于你输入的提示词（Prompt）——也就是你跟 AI 说的"那几句话"。把 AI 想象成一个非常能干但缺乏主动性的实习生。你如果说「帮我做点事」，他会一脸茫然。但如果你说「帮我整理这份会议纪要，按议题分类，每项...

2026/05/15

教程入门⏱ 8 分钟

大模型是怎么「学会」东西的？

--- --- --- 想象一下：你面前有一台巨大的计算机。它刚刚被造出来，里面什么都没有——就像刚出生的婴儿，一张白纸。然后你给它"喂"了互联网上几乎所有的文字——新闻、维基百科、小说、论文、代码、论坛帖子、对话记录…… 几个月后，这台计算机居然能跟你聊天了。你问它"怎么做红烧肉"，它能写出详细的菜谱。你让它"写一首关于秋天的诗"，它能写出押韵的句子。这中间到底发生了什么？它到底是怎么"学会...

2026/05/15

教程入门⏱ 8 分钟

大模型的前世今生 —— 从 1956 到 ChatGPT

--- --- --- 你可能觉得 DeepSeek、豆包这些 AI 工具是"突然冒出来"的。但其实，你今天能跟 AI 聊天，背后是几十万科研人员花了近 70 年的心血。如果把 AI 的发展比作一部电影，那前面 60 多年都是漫长的铺垫，真正的"高潮"其实只发生在最近三四年。 --- 1956 年夏天，一群年轻的计算机科学家在美国达特茅斯学院开了个会。他们中有一个叫约翰·麦卡锡（John McC...

2026/05/15

教程入门⏱ 9 分钟

AI到底是个啥？—— AI/ML/DL/LLM 概念层层剥开

--- --- --- 先别急着看定义。我们来看几个场景： - 早上打开豆包，让它帮你写一封请假邮件 - 刷短视频时，系统总能精准推荐你喜欢的内容 - 拍照发朋友圈，手机自动把人脸变好看（美颜） - 用DeepSeek查资料，几秒钟就整理出一份报告大纲 - 购物 App 总能猜到你最近想买什么这些场景背后，都有一项共同技术在支撑——人工智能（Artificial Intelligence，简称 ...

2026/05/15

技术前沿大模型预训练高级⏱ 15 分钟