上一期,我們團隊統(tǒng)計了市面上50多款面對公眾服務(wù)的政務(wù)AI導(dǎo)辦、國央企政務(wù)及法律咨詢AI、單位辦事機構(gòu)的咨詢助手AI、智能問答類AI,做了詳細的測試調(diào)研。結(jié)果發(fā)現(xiàn),50多款常用政務(wù)資訊類AI、法律咨詢AI中,70%存在法條援引錯誤,18%在價值判斷環(huán)節(jié)出現(xiàn)原則性失誤。政務(wù)及法律咨詢AI“胡說八道”,是一個非常普遍且嚴重的現(xiàn)象。然而,認識風(fēng)險只是開始。真正令人警醒的,是當(dāng)這些技術(shù)局限遇上法律實踐近乎'零容忍’的精確性要求時,會碰撞出怎樣的火花? 是效率的提升,還是災(zāi)難的序幕? 下一期,我們將不再止步于揭露問題。 我們將帶來曙光:深度解析一款經(jīng)中國工信部權(quán)威測評認證、實現(xiàn)法律內(nèi)容'零幻覺’的新一代專業(yè)法律大模型,探尋根治這一行業(yè)痛點的技術(shù)路徑。智能AI能否真正成為值得信賴的助手?答案即將揭曉。 最近,Ellis George 和 K&L Gates 這兩家律所翻了大車,還被聯(lián)邦法院直接罰了 31000 美元,因為在這兩家律所被法官查出在 Lacey v. State Farm 案里用生成式 AI 寫訴狀引用了虛假案例。 主審法官過Westlaw在線數(shù)據(jù)庫和法律研究服務(wù)核查時,發(fā)現(xiàn)了諸多觸目驚心的錯誤:- 多個引用的司法意見書中的引文是偽造的,與實際材料不符;
- 還有多處引用的判決書內(nèi)容被篡改得面目全非,與實際原文對不上號。
K&L Gates作為美國律所50強之一,擁有龐大資源和專業(yè)團隊,訴狀經(jīng)過多方審查,竟無人發(fā)現(xiàn)問題,最后居然還能順利遞交到主審法官手中。如果將這些虛假材料納入司法命令,造成的后果不敢想象有多嚴重、多恐怖!這是對當(dāng)事人、整個司法系統(tǒng)乃至當(dāng)下社會的嚴重不負責(zé)任!越問越懵,胡說八道 廣州一政務(wù)AI回答讓人傻眼! 在今年的4月份,廣州某政務(wù)系統(tǒng)的政務(wù)服務(wù)大模型智能體和問答智能系統(tǒng)被南方都市報等各大官方媒體“點名”,導(dǎo)致整個政務(wù)系統(tǒng)引發(fā)信任危機!原來有市民想在該行政區(qū)域開辦創(chuàng)業(yè)公司,在該行政區(qū)的官網(wǎng)的政務(wù)服務(wù)大模型提問“應(yīng)屆畢業(yè)生開公司有什么優(yōu)惠政策”時,該大模型雖經(jīng)過“深度思考”,卻將問題導(dǎo)向“勞動就業(yè)服務(wù)”和“社會保險”,與用戶問題毫無關(guān)聯(lián)。▼更令人困惑的是,用戶后續(xù)無法自由輸入信息,只能被動選擇系統(tǒng)預(yù)設(shè)選項,或者刷新后重新輸入問題,導(dǎo)致咨詢流程中斷。而另外一個智能問答系統(tǒng)在面臨同一問題時,則在二次確認“請問您想咨詢的是?”后,便不再提供進一步的信息和內(nèi)容,用戶咨詢陷入“無下文”狀態(tài)。▼熊貓法律星球團隊在咨詢“科技型中小企業(yè)如何申請貸款貼息”時,這個政務(wù)智能問答平臺沒有直接解答,而是關(guān)聯(lián)了6個服務(wù)引導(dǎo),但是其中4個引導(dǎo)與問題毫無聯(lián)系,比如:“排污許可證核發(fā)”、“申請注銷駕駛證”等。更讓人困惑的是,點擊其中一條指引后,便不再提供進一步的信息和內(nèi)容,該智能問答政務(wù)AI陷入“無下文”狀態(tài)。對于這次的烏龍,不僅被官方媒體點名,市民用戶也是一頓吐槽:企政府單位與法律行業(yè) 做AI大模型豈能兒戲?
政務(wù)咨詢類AI、政務(wù)服務(wù)大模型不同于市面上的娛樂問答類AI,政務(wù)信息智能體,代表著國家政務(wù)機構(gòu)的權(quán)威形象與公信力根基,其輸出的每一項政策解讀、每一次服務(wù)響應(yīng),都承載著政府對公眾的責(zé)任承諾,容不得絲毫戲謔化、隨意化處理。這類政務(wù)咨詢AI系統(tǒng)的搭建與應(yīng)用,不能應(yīng)付式嘗試,必須依托經(jīng)過嚴格技術(shù)驗證、具備高度數(shù)據(jù)準確性和合規(guī)性的靠譜大模型,以確保信息供給的嚴謹性、服務(wù)響應(yīng)的專業(yè)性,從技術(shù)底座上筑牢維護國家政務(wù)公信力的防線。能讓用戶市民感到便捷的、人性化、解決實質(zhì)性問題的大模型,才是真正有效的AI工具。認識風(fēng)險只是破局的第一步,如何從技術(shù)根源找到靠譜的AI工具?明天我們將深度拆解國內(nèi)首款通過工信部權(quán)威測評、實現(xiàn)法律內(nèi)容 “零幻覺” 的專業(yè)大模型,揭秘其如何用三重技術(shù)防線攻克 “法條虛構(gòu)”、“案例扭曲” 等行業(yè)頑疾,更將直擊政務(wù)服務(wù)場景的落地實踐,看靠譜大模型如何讓政策咨詢從 “流程中斷” 變?yōu)?“精準響應(yīng)”。
|