我怕 AI 亂講，所以去翻了 OpenAI、Anthropic、Google 的研究

我用 AI 用得很兇，但心裡一直有個結：它查給我的東西，到底能不能信？

與其繼續焦慮，我做了一件行銷人最熟的事——去翻原始資料。我把 OpenAI、Anthropic、Google 三家的官方研究讀過一輪，整理成人話分享給你。

第一個發現：AI 亂講不是壞掉，是設計使然

OpenAI 在 2025 年的論文〈Why Language Models Hallucinate〉裡講得很白：模型在訓練時，「猜對」會被獎勵、「老實說不知道」卻沒獎勵。久而久之，它學會的策略就是——寧可自信地瞎掰，也不要承認不會。

更殘酷的是，他們證明這沒辦法靠標準訓練根除，是結構性的。換句話說，期待哪天 AI「自己變得不亂講」是不切實際的；真正能做的，是在「使用端」設防。

Anthropic 的官方文件給了一組可以直接照做的技巧：

而 Google Cloud 引用的研究顯示：讓答案「接地（grounding／RAG）」，幻覺可以降低 42–68%。

別跟 AI 比「它記得多準」，而是逼它把每句話都講得「可回溯來源」。生成是它的強項，當真相來源是它的弱項——那就別讓它當來源，讓它當「整理工」，真相交給可查證的資料。

說到底，會用 AI 的人，從來不是「全信 AI」的人，而是知道怎麼逼它說真話的人。當生成變得免費，這份「查證的紀律」反而成了稀缺品。

而這篇，就是我自己的紀律之一：不只丟給你結論，連我從哪讀來的都附上。

參考來源

OpenAI〈Why Language Models Hallucinate〉：arxiv.org/pdf/2509.04664
Anthropic〈Reduce hallucinations〉：platform.claude.com/docs
Google Cloud〈What are AI hallucinations?〉：cloud.google.com/discover/what-are-ai-hallucinations