醫療界保守觀望，法律界衝在前面，卻被 AI 假判例咬了一口

醫療業比較保守，對於讓 AI 介入醫療流程，並不是非常積極。

那我們來看看比較積極的法律界，以及專用且付費的法律 AI 工具，表現如何呢？

美國兩位律師因為使用 AI 生成書狀，裡面包含多件根本不存在的判例、張冠李戴的引文，以及對真實案件極其離譜的誤導性陳述，被法官發現，進而調查。

最終，法官裁決這兩位律師六個月不得執業，而且要求他們書面通知自己的客戶、對造律師、所有進行中案件的法官，以及事務所裡的其他律師，同時把裁定送交加州律師公會。

這兩位律師一路都否認使用 AI，堅稱只是打字錯誤。直到言詞辯論被追問了好幾輪，其中一位才終於鬆口，承認「可能」是負責撰稿的人用了 AI；另一份書面說明裡甚至寫著，他們審閱時「通常不會去查核撰稿者引用的判例」。

但因為書狀上簽的是律師自己的名字，這樣的辯解不被接受。簽名，就代表你保證親自看過、確認無誤。

法官也回顧了相關研究，結論是，專用的法律 AI 工具，表現實在不怎麼樣。

根據 2024 年針對一組具代表性查詢的測試，Thomson Reuters 的 Westlaw，答案出現虛假訊息的比例高達 33%；LexisNexis 的 Lexis 也有 17%。（研究還發現，Westlaw 之所以更高，是因為它的回答更長、更愛多講。）

這些還是用了 RAG 架構的喔，Retrieval-Augmented Generation，也就是先根據問題去檢索相關資料（相關資訊、參考文獻等），再把問題連同查到的資料一起丟進模型生成回覆。

Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools, 22 J. Empirical Legal Stud. 216 (2025)

而即使最新一代工具，依然錯誤百出。最常見的錯誤模式，包括誤解判決要旨、無法區分法律行為人（例如：把被駁回的當事人主張，誤植為法院的判決要旨），以及不尊重法律位階等。

目前關於法律與 AI 的關係，有幾個代表性的故事：

一、UC Berkeley 法學院的學生濫用 AI，交出根本不存在的判例跟站不住腳的論述，被教授認定那「不是你的判斷，是 OpenAI 或 Anthropic 的判斷」，等於抄襲，進而禁用。這篇我們之前寫過。

二、Stanford 研究發現，在沒有標準答案的契約法問題上，把 AI 寫的見解跟法學教授寫的見解放在一起，請契約法教授盲測二選一，結果 AI 的見解以約 75% 對 25% 勝過教授同行。更尖銳的是，被標記為「可能誤導、傷害學生學習」的比例，AI 只有 3.5%，真人教授的見解卻有 12%。這篇我們之前也討論過。

三、然後就是像這次這樣，聰明的律師們，拿著假判例跟錯誤論述去開庭被抓包。光是被法院正式記錄下來的，全球已經超過一千五百件，光美國就有一千多件。有人專門建了資料庫在統計。

在法律的世界，搞出這種烏龍，後果就是休息半年不能執業。客戶的案子可能被耽誤，得換律師接手；客戶若想為損失求償，還得自己另外對這兩位律師提起訴訟，法院的懲戒並不會幫你把錢要回來。

這種狀況，如果搬到醫療業，不知會搞出什麼問題？最後又該怎麼收拾？你認為呢？

醫療界保守觀望，法律界衝在前面，卻被 AI 假判例咬了一口

延伸閱讀