醫療業比較保守,對於讓 AI 介入醫療流程,並不是非常積極。

那我們來看看比較積極的法律界,以及專用且付費的法律 AI 工具,表現如何呢?

美國兩位律師因為使用 AI 生成書狀,裡面包含多件根本不存在的判例、張冠李戴的引文,以及對真實案件極其離譜的誤導性陳述,被法官發現,進而調查

最終,法官裁決這兩位律師六個月不得執業,而且要求他們書面通知自己的客戶、對造律師、所有進行中案件的法官,以及事務所裡的其他律師,同時把裁定送交加州律師公會。

這兩位律師一路都否認使用 AI,堅稱只是打字錯誤。直到言詞辯論被追問了好幾輪,其中一位才終於鬆口,承認「可能」是負責撰稿的人用了 AI;另一份書面說明裡甚至寫著,他們審閱時「通常不會去查核撰稿者引用的判例」。

但因為書狀上簽的是律師自己的名字,這樣的辯解不被接受。簽名,就代表你保證親自看過、確認無誤。

法官也回顧了相關研究,結論是,專用的法律 AI 工具,表現實在不怎麼樣。

根據 2024 年針對一組具代表性查詢的測試,Thomson Reuters 的 Westlaw,答案出現虛假訊息的比例高達 33%;LexisNexis 的 Lexis 也有 17%。(研究還發現,Westlaw 之所以更高,是因為它的回答更長、更愛多講。)

這些還是用了 RAG 架構的喔,Retrieval-Augmented Generation,也就是先根據問題去檢索相關資料(相關資訊、參考文獻等),再把問題連同查到的資料一起丟進模型生成回覆。

Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools, 22 J. Empirical Legal Stud. 216 (2025)

而即使最新一代工具,依然錯誤百出。最常見的錯誤模式,包括誤解判決要旨、無法區分法律行為人(例如:把被駁回的當事人主張,誤植為法院的判決要旨),以及不尊重法律位階等。

目前關於法律與 AI 的關係,有幾個代表性的故事:

一、UC Berkeley 法學院的學生濫用 AI,交出根本不存在的判例跟站不住腳的論述,被教授認定那「不是你的判斷,是 OpenAI 或 Anthropic 的判斷」,等於抄襲,進而禁用。這篇我們之前寫過

二、Stanford 研究發現,在沒有標準答案的契約法問題上,把 AI 寫的見解跟法學教授寫的見解放在一起,請契約法教授盲測二選一,結果 AI 的見解以約 75% 對 25% 勝過教授同行。更尖銳的是,被標記為「可能誤導、傷害學生學習」的比例,AI 只有 3.5%,真人教授的見解卻有 12%。這篇我們之前也討論過

三、然後就是像這次這樣,聰明的律師們,拿著假判例跟錯誤論述去開庭被抓包。光是被法院正式記錄下來的,全球已經超過一千五百件,光美國就有一千多件。有人專門建了資料庫在統計

在法律的世界,搞出這種烏龍,後果就是休息半年不能執業。客戶的案子可能被耽誤,得換律師接手;客戶若想為損失求償,還得自己另外對這兩位律師提起訴訟,法院的懲戒並不會幫你把錢要回來。

這種狀況,如果搬到醫療業,不知會搞出什麼問題?最後又該怎麼收拾?你認為呢?