· Celia · AI工具 · 3 min read
我怕 AI 亂講,所以去翻了 OpenAI、Anthropic、Google 的研究
與其每天焦慮 AI 會不會唬我,我乾脆去讀了三家的官方研究,整理成人話。結論有點顛覆。

我用 AI 用得很兇,但心裡一直有個結:它查給我的東西,到底能不能信?
與其繼續焦慮,我做了一件行銷人最熟的事——去翻原始資料。我把 OpenAI、Anthropic、Google 三家的官方研究讀過一輪,整理成人話分享給你。
第一個發現:AI 亂講不是壞掉,是設計使然
OpenAI 在 2025 年的論文〈Why Language Models Hallucinate〉裡講得很白:模型在訓練時,「猜對」會被獎勵、「老實說不知道」卻沒獎勵。久而久之,它學會的策略就是——寧可自信地瞎掰,也不要承認不會。
更殘酷的是,他們證明這沒辦法靠標準訓練根除,是結構性的。換句話說,期待哪天 AI「自己變得不亂講」是不切實際的;真正能做的,是在「使用端」設防。
第二個發現:壓制幻覺的方法,其實很樸素
Anthropic 的官方文件給了一組可以直接照做的技巧:
- 明白允許 AI 說「我不知道」——光是這句話,就能大幅減少編造。
- 長文先逐字引用原文,再根據引用作答——讓它的答案接地在真實文字上。
- 每個主張都附來源,找不到佐證就撤回該主張——不准它留下無法查證的話。
- 只准用提供的資料、不准用常識——把它的自由發揮關掉。
而 Google Cloud 引用的研究顯示:讓答案「接地(grounding/RAG)」,幻覺可以降低 42–68%。
三家權威,講的是同一件事
別跟 AI 比「它記得多準」,而是逼它把每句話都講得「可回溯來源」。生成是它的強項,當真相來源是它的弱項——那就別讓它當來源,讓它當「整理工」,真相交給可查證的資料。
說到底,會用 AI 的人,從來不是「全信 AI」的人,而是知道怎麼逼它說真話的人。當生成變得免費,這份「查證的紀律」反而成了稀缺品。
而這篇,就是我自己的紀律之一:不只丟給你結論,連我從哪讀來的都附上。
參考來源
- OpenAI〈Why Language Models Hallucinate〉:arxiv.org/pdf/2509.04664
- Anthropic〈Reduce hallucinations〉:platform.claude.com/docs
- Google Cloud〈What are AI hallucinations?〉:cloud.google.com/discover/what-are-ai-hallucinations