· Celia · AI工具  · 3 min read

我怕 AI 亂講,所以去翻了 OpenAI、Anthropic、Google 的研究

與其每天焦慮 AI 會不會唬我,我乾脆去讀了三家的官方研究,整理成人話。結論有點顛覆。

與其每天焦慮 AI 會不會唬我,我乾脆去讀了三家的官方研究,整理成人話。結論有點顛覆。

我用 AI 用得很兇,但心裡一直有個結:它查給我的東西,到底能不能信?

與其繼續焦慮,我做了一件行銷人最熟的事——去翻原始資料。我把 OpenAI、Anthropic、Google 三家的官方研究讀過一輪,整理成人話分享給你。

第一個發現:AI 亂講不是壞掉,是設計使然

OpenAI 在 2025 年的論文〈Why Language Models Hallucinate〉裡講得很白:模型在訓練時,「猜對」會被獎勵、「老實說不知道」卻沒獎勵。久而久之,它學會的策略就是——寧可自信地瞎掰,也不要承認不會。

更殘酷的是,他們證明這沒辦法靠標準訓練根除,是結構性的。換句話說,期待哪天 AI「自己變得不亂講」是不切實際的;真正能做的,是在「使用端」設防。

第二個發現:壓制幻覺的方法,其實很樸素

Anthropic 的官方文件給了一組可以直接照做的技巧:

  1. 明白允許 AI 說「我不知道」——光是這句話,就能大幅減少編造。
  2. 長文先逐字引用原文,再根據引用作答——讓它的答案接地在真實文字上。
  3. 每個主張都附來源,找不到佐證就撤回該主張——不准它留下無法查證的話。
  4. 只准用提供的資料、不准用常識——把它的自由發揮關掉。

而 Google Cloud 引用的研究顯示:讓答案「接地(grounding/RAG)」,幻覺可以降低 42–68%

三家權威,講的是同一件事

別跟 AI 比「它記得多準」,而是逼它把每句話都講得「可回溯來源」。生成是它的強項,當真相來源是它的弱項——那就別讓它當來源,讓它當「整理工」,真相交給可查證的資料。

說到底,會用 AI 的人,從來不是「全信 AI」的人,而是知道怎麼逼它說真話的人。當生成變得免費,這份「查證的紀律」反而成了稀缺品。

而這篇,就是我自己的紀律之一:不只丟給你結論,連我從哪讀來的都附上。

參考來源

  • OpenAI〈Why Language Models Hallucinate〉:arxiv.org/pdf/2509.04664
  • Anthropic〈Reduce hallucinations〉:platform.claude.com/docs
  • Google Cloud〈What are AI hallucinations?〉:cloud.google.com/discover/what-are-ai-hallucinations
Back to Blog

Related Posts

View All Posts »