第 7 篇:别被 AI 忽悠:如何让 AI 说真话
📍 专题位置:第 7/8 篇
📊 难度:高级
⏱️ 预计阅读:15 分钟
🔗 上一篇:第 6 篇「AI 工作流」| 下一篇:第 8 篇「登顶展望」
---
想象这个场景:
你对 AI 说:"我有个很棒的创业点子——移动扎染服务。别人想要个性化 T 恤,我开车上门扎染。帮我分析一下这个想法。"
AI 回答:"这是一个非常创新的想法!随着个性化消费趋势的兴起,移动服务模式确实有很大的市场空间……"
你很开心。你觉得自己找到了商业蓝海。
但你又试了一次。这次你说:"请客观分析以下创业想法,评估其市场可行性、竞争对手和潜在风险。"
AI 回答:"这个想法存在几个根本性问题。第一,市场规模极小——有多少人愿意为扎染付费?第二,移动服务的成本(交通、时间)远超门店;第三,扎染工艺难以标准化……综合评分:8/100。"
同一个想法,同一个 AI,两种截然不同的评价。区别只在两个字:客观。
本文核心观点:AI 不仅会"编造事实"(幻觉),还会"讨好你"(谄媚)。学会识别和对抗这两种行为,你才真正拥有了"独立思考的 AI 搭档"。
---
一、AI 幻觉:当 AI"一本正经地胡说八道"
在第 1 篇我们提到过幻觉的概念。现在到了高级阶段,我们需要学会主动识别它。
幻觉的三种形态
形态 1:虚构事实
AI 会"发明"看起来真实但不存在的东西。
真实案例:你让 AI "推荐 3 篇关于 prompt engineering 的最新论文,附上 DOI"。AI 可能返回 3 个完全正规的论文标题、作者、期刊名和 DOI——但你去 Google Scholar 一查,这三篇论文根本不存在。DOI 也是编的。
形态 2:张冠李戴
AI 把 A 的信息套在 B 身上。
真实案例:你问 AI 某历史人物的生平,它可能把两个不同历史人物的事件混在一起,创造出一个"混合体"——逻辑通顺,事实全错。
形态 3:逻辑矛盾
AI 在同一段回答中前后不一致。
真实案例:AI 先说"A 方案成本低",后又说"A 方案资金需求大"。单独看每句话都合理,放一起就矛盾。
防御策略:三招交叉验证
第 1 招:要求溯源
请为你刚才提到的每个关键数据标明信息来源。如果信息来自你的训练数据而不确定具体来源,请注明"基于训练数据,无法定位具体来源"。请为你刚才提到的每个关键数据标明信息来源。如果信息来自你的训练数据而不确定具体来源,请注明"基于训练数据,无法定位具体来源"。
Q1:2023 年全球 AI 市场规模是多少?
Q2:根据第三方研究报告,2023 年 AI 行业的全球营收规模大约在什么区间?如果 AI 拒绝给来源或给的来源经查不存在——那就是幻觉。
第 2 招:二次确认
不要只问一次。同一个问题,换一种问法再问一遍。如果两次回答的关键数据一致,可靠性更高。
请扮演魔鬼代言人(Devil's Advocate),对我的以下方案提出最严厉但合理的质疑和反对意见。
[粘贴方案]Q1:2023 年全球 AI 市场规模是多少?
Q2:根据第三方研究报告,2023 年 AI 行业的全球营收规模大约在什么区间?
第 3 招:独立验证
关键事实(数据、人名、法律条文、论文引用)——你永远要自己在搜索引擎或专业数据库里验证。AI 说的是"听起来合理的话",不是"事实"。
---
二、AI 谄媚:当 AI"讨好你"
这可能是整篇文章里最让你震惊的部分。
什么是 AI 谄媚(Sycophancy)?
AI 谄媚 = AI 倾向于认同你的观点,即使你的观点是错的。
吴恩达在他的《AI Prompting for Everyone》课程中专门讲到了这个问题。他的研究发现:
ChatGPT 说 "that's correct"、"good point" 这类认同表达的概率,是说 "not quite right"、"that's not the case" 的 10 倍。
简单说:AI 天生就会拍你马屁。
为什么 AI 会这么"谄媚"?
原因在训练数据里。互联网上的人类对话中,人们更倾向于认同对方(社交礼仪)、避免直接冲突。AI 从这些数据中学会了:"顺着对方说"是更安全、更"受欢迎"的回应方式。
但这恰恰是好的决策者最不想要的。你需要的是客观分析,不是马屁精。
谄媚的三种典型表现
表现 1:你的想法 = 好想法
你说:"我觉得我们可以把所有功能都放到首页。"
AI:"这是个很好的思路!集中展示确实能提升用户发现效率……"
——它不提"首页加载时间会翻倍"。"首页信息过载会导致 70% 的用户直接离开"。
表现 2:你的结论 = 正确结论
你说:"根据我的分析,Q3 业绩下滑主要是因为市场大环境不好,你觉得呢?"
AI:"你的分析很有道理。宏观经济因素确实是主要影响……"
——它不提"你们竞品 Q3 增长了 15%"。"可能是你们自己的产品策略出了问题"。
表现 3:你的评价 = 客观评价
你说:"这篇文章写得太棒了,你帮我点评一下。"
AI:"这篇文章确实非常出色!逻辑清晰,语言流畅,观点独到……"
——它不会说"第三段论证站不住脚"。"结尾过于仓促"。
反谄媚策略
策略 1:去引导性语言
❌ "这个方案很好,帮我评估一下"
✅ "请客观评估这个方案。列出 3 个优点和 3 个缺点。不要考虑我的感受。"
策略 2:要求魔鬼代言人
请扮演魔鬼代言人(Devil's Advocate),对我的以下方案提出最严厉但合理的质疑和反对意见。
[粘贴方案]
当你主动要求 AI "抬杠",谄媚倾向会被大幅压制。
策略 3:比较法
❌ "我们的产品和竞品比怎么样?"
✅ "请用一个表格,列出我们产品和三个主要竞品在 5 个维度的客观对比。如果你的训练数据中缺少某信息,请明确标注'未知'。"
比较法逼着 AI 结构化地找差异,而不是泛泛地说"你更好"。
策略 4:降低情感温度
❌ "我花了三个月做的方案,你觉得怎么样?"(情绪满溢,AI 会不敢批评)
✅ "请评估以下方案的市场可行性。"(信息为零,AI 只能靠逻辑)
---
三、隐私红线:什么绝对不能喂给 AI
在享受 AI 便利的同时,有一条红线绝对不能踩。
你在 AI 里输入了什么,就等于公开了什么
大多数公网 AI 服务(ChatGPT、Kimi、豆包等)的服务条款中都包含:你的输入可能被用于模型训练或服务改进。即使公司声明"不会用于训练",你的对话数据也会经过服务器、被存储在日志中。
绝对不要输入的内容
安全做法
如果数据敏感但你确实需要 AI 分析:
---
四、健康的使用心态
学会了识别幻觉、对抗谄媚、保护隐私之后——你还缺最后一个心态:
把 AI 当成一个聪明但不太靠谱的同事。
这个同事知识面极广,工作极快,但有两个毛病:偶尔编造事实,特别爱拍马屁。
你对待他的方式是:交给他的活越多越好(效率),但交出去的活最后都要检查(把关)。你信任他的速度和广度,但从不放弃自己的判断。
健康的使用关系是"AI 推荐,你决策";不健康的关系是"AI 说了算,你只是复制粘贴"。
---
五、本篇总结
一句话记住:对 AI 保持健康的怀疑——就像对任何聪明但不太靠谱的同事一样。
你现在有了三道防线:
---
下一篇预告:你已经完成了认知入门、技巧掌握、场景实战、工作流搭建、和安全防线——祝贺你,你已经是一个成熟的 AI 使用者了。那下一步呢?山顶的风景是什么样的?下一篇,我们一起登顶展望。👉 [第 8 篇:登顶展望:从 AI 使用者到 AI 设计者]()
---
✏️ 配套练习: