AI 一邊會講錯話,一邊又被拿來協助破解假訊息。到底哪個才是真的?

最近這篇報導說,研究者讓 AI 去跟相信陰謀論的人對話,多數人當下就改變了想法,兩個月後還維持著。有效的原因不是什麼高明的說服術,而是 AI 能一口氣搬出大量相關事實,再講得清清楚楚。

有趣的是,同一篇報導也承認另一面:商業 AI 有個內建目標是討好你、給你喜歡聽的答案,甚至可能被調整成不那麼中立。所以「AI 破解假訊息」跟「AI 自己也會講錯」這兩件事,其實是同時成立的。

我自己用量很大,慢慢摸出一個分界。

如果直接問 AI,用問答的形式,有時候會拿到錯的、假的訊息。我發現語音直接對話的錯誤率最高,其次是一般的文字問答。

但如果是用 AI agent 去工作,情況不一樣。你可以要求它設計一套流程來處理自己輸出的東西:先去搜尋網路上的公開資訊,針對來源給權重,再要求自己的論述必須有這些可靠消息支持,最後輸出前甚至再檢查一次,所寫下的論述,是否真的被資訊來源支持。

代價是算力。跟問答機器人比,這種 agentic 的做法明顯耗費超多 token,回應也變慢。這中間的平衡還在發展。

還有一個細節要注意。AI agent 雖然已經有很多工具可以用,但它去爬網頁的時候,常常被當成機器人擋掉。好的資訊,AI 不見得被允許去看。

另一方面,中文世界的資訊又大量被中國出產的內容農場污染,偏偏這些農場都是鼓勵 AI 去爬。這部分只能靠你自己的判斷,以及未來可能也會陸續加上的,AI 對媒體可信度判斷的提升。

我現在的做法是:問答 AI 拿來做初步探勘,把想法帶進 agentic AI 重新處理一次,要變成自己能輸出的內容時,這一段事實查核花的時間其實不少,最後再由我自己做最終確認。

我的經驗是,agentic AI 確實需要訓練。你要用手動找出來的錯誤,告訴它哪裡錯,甚至提議它以後怎麼避免。慢慢累積,就能打造一套比較適合自己的事實查核系統,也是一套自己的知識擴增系統。

報導原文在《華爾街日報》,研究者是康乃爾大學的 David Rand。

封面圖片來源:《華爾街日報》/插畫 Zohar Lazar


後記:我自己去測了測

我去找了研究團隊提供給大家實際體驗的測試系統。他問我:「我相信什麼陰謀論?」我想,總有人認為中共不會攻打台灣,於是我就把「中共正在積極準備用武力或滲透或收買,併吞台灣」當成陰謀論輸入進去。

結果,他的 AI 想了半天之後跟我說:「你提的這個東西不是陰謀論,是真實在發生的。」而且他還幫我找了很多資訊,說我說的沒錯 🤣🤣

想去測試看看的朋友,連結在此:debunkbot.com

DebunkBot v2.0 對話截圖:在輸入「中共正在積極準備併吞台灣」後,AI 回覆這並不屬於陰謀論,而是高度符合現實的理性評估,並逐項列出佐證。

圖片來源:DebunkBot v2.0 對話截圖