【原】政務(wù)AI幻覺翻車實錄：罰款、打臉與深刻教訓(xùn)

熊貓法律星球 2025-05-30 發(fā)布于黑龍江

展開全文

上一期，我們團隊統(tǒng)計了市面上50多款面對公眾服務(wù)的政務(wù)AI導(dǎo)辦、國央企政務(wù)及法律咨詢AI、單位辦事機構(gòu)的咨詢助手AI、智能問答類AI，做了詳細的測試調(diào)研。

結(jié)果發(fā)現(xiàn)，50多款常用政務(wù)資訊類AI、法律咨詢AI中，70%存在法條援引錯誤，18%在價值判斷環(huán)節(jié)出現(xiàn)原則性失誤。政務(wù)及法律咨詢AI“胡說八道”，是一個非常普遍且嚴重的現(xiàn)象。

點此回顧??

我們發(fā)現(xiàn)市面上80%的法律AI都一本正經(jīng)地胡說八道！虛構(gòu)法條、扭曲案例有多可怕？

然而，認識風(fēng)險只是開始。真正令人警醒的，是當(dāng)這些技術(shù)局限遇上法律實踐近乎'零容忍’的精確性要求時，會碰撞出怎樣的火花？ 是效率的提升，還是災(zāi)難的序幕？

下期預(yù)告

下一期，我們將不再止步于揭露問題。 我們將帶來曙光：深度解析一款經(jīng)中國工信部權(quán)威測評認證、實現(xiàn)法律內(nèi)容'零幻覺’的新一代專業(yè)法律大模型，探尋根治這一行業(yè)痛點的技術(shù)路徑。智能AI能否真正成為值得信賴的助手？答案即將揭曉。

27個引證中9個有問題

頂級律所被AI幻覺坑了

美國大所也栽在 AI 手里了。

最近，Ellis George 和 K&L Gates 這兩家律所翻了大車，還被聯(lián)邦法院直接罰了 31000 美元，因為在這兩家律所被法官查出在 Lacey v. State Farm 案里用生成式 AI 寫訴狀引用了虛假案例。

主審法官過Westlaw在線數(shù)據(jù)庫和法律研究服務(wù)核查時，發(fā)現(xiàn)了諸多觸目驚心的錯誤：

27個引證中有9個存在問題，占總引證的三分之一；
至少兩個引用的權(quán)威案例完全不存在；
多個引用的司法意見書中的引文是偽造的，與實際材料不符；
還有多處引用的判決書內(nèi)容被篡改得面目全非，與實際原文對不上號。

K&L Gates作為美國律所50強之一，擁有龐大資源和專業(yè)團隊，訴狀經(jīng)過多方審查，竟無人發(fā)現(xiàn)問題，最后居然還能順利遞交到主審法官手中。

如果將這些虛假材料納入司法命令，造成的后果不敢想象有多嚴重、多恐怖！這是對當(dāng)事人、整個司法系統(tǒng)乃至當(dāng)下社會的嚴重不負責(zé)任！

越問越懵，胡說八道

廣州一政務(wù)AI回答讓人傻眼！

在今年的4月份，廣州某政務(wù)系統(tǒng)的政務(wù)服務(wù)大模型智能體和問答智能系統(tǒng)被南方都市報等各大官方媒體“點名”，導(dǎo)致整個政務(wù)系統(tǒng)引發(fā)信任危機！

具體是怎么回事？

原來有市民想在該行政區(qū)域開辦創(chuàng)業(yè)公司，在該行政區(qū)的官網(wǎng)的政務(wù)服務(wù)大模型提問“應(yīng)屆畢業(yè)生開公司有什么優(yōu)惠政策”時，該大模型雖經(jīng)過“深度思考”，卻將問題導(dǎo)向“勞動就業(yè)服務(wù)”和“社會保險”，與用戶問題毫無關(guān)聯(lián)。▼

更令人困惑的是，用戶后續(xù)無法自由輸入信息，只能被動選擇系統(tǒng)預(yù)設(shè)選項，或者刷新后重新輸入問題，導(dǎo)致咨詢流程中斷。

而另外一個智能問答系統(tǒng)在面臨同一問題時，則在二次確認“請問您想咨詢的是？”后，便不再提供進一步的信息和內(nèi)容，用戶咨詢陷入“無下文”狀態(tài)。▼

熊貓法律星球團隊在咨詢“科技型中小企業(yè)如何申請貸款貼息”時，這個政務(wù)智能問答平臺沒有直接解答，而是關(guān)聯(lián)了6個服務(wù)引導(dǎo)，但是其中4個引導(dǎo)與問題毫無聯(lián)系，比如：“排污許可證核發(fā)”、“申請注銷駕駛證”等。

更讓人困惑的是，點擊其中一條指引后，便不再提供進一步的信息和內(nèi)容，該智能問答政務(wù)AI陷入“無下文”狀態(tài)。

對于這次的烏龍，不僅被官方媒體點名，市民用戶也是一頓吐槽：

企政府單位與法律行業(yè)

做AI大模型豈能兒戲？

政務(wù)咨詢類AI、政務(wù)服務(wù)大模型不同于市面上的娛樂問答類AI，政務(wù)信息智能體，代表著國家政務(wù)機構(gòu)的權(quán)威形象與公信力根基，其輸出的每一項政策解讀、每一次服務(wù)響應(yīng)，都承載著政府對公眾的責(zé)任承諾，容不得絲毫戲謔化、隨意化處理。

這類政務(wù)咨詢AI系統(tǒng)的搭建與應(yīng)用，不能應(yīng)付式嘗試，必須依托經(jīng)過嚴格技術(shù)驗證、具備高度數(shù)據(jù)準確性和合規(guī)性的靠譜大模型，以確保信息供給的嚴謹性、服務(wù)響應(yīng)的專業(yè)性，從技術(shù)底座上筑牢維護國家政務(wù)公信力的防線。

能讓用戶市民感到便捷的、人性化、解決實質(zhì)性問題的大模型，才是真正有效的AI工具。

下期預(yù)告

認識風(fēng)險只是破局的第一步，如何從技術(shù)根源找到靠譜的AI工具？

明天我們將深度拆解國內(nèi)首款通過工信部權(quán)威測評、實現(xiàn)法律內(nèi)容 “零幻覺” 的專業(yè)大模型，揭秘其如何用三重技術(shù)防線攻克 “法條虛構(gòu)”、“案例扭曲” 等行業(yè)頑疾，更將直擊政務(wù)服務(wù)場景的落地實踐，看靠譜大模型如何讓政策咨詢從 “流程中斷” 變?yōu)?“精準響應(yīng)”。