「創(chuàng)業(yè)最前線」旗下「科技最前線」原創(chuàng)出品 作者 | 北行三 戰(zhàn)火升級(jí)才半年不見,Project Debater就學(xué)壞了。 2019年2月11日,AI和人類冠軍辯手在舊金山進(jìn)行了史上第二次人機(jī)辯論賽,第一次的主角也是它,IBM研發(fā)的人工智能:Project Debater。 (Project Debater) 很難想象,眼前這塊像液晶廣告牌一樣的東西就是IBM目前在AI領(lǐng)域最新的研發(fā)成果,而它最擅長(zhǎng)的事,就是跟人類“抬杠”。 去年的6月的人機(jī)辯論首戰(zhàn),它的兩個(gè)對(duì)手都是來自以色列的頂級(jí)辯論專家,最終戰(zhàn)績(jī)1勝1負(fù)。 今年在IBM的Think 2019大會(huì)上,這位AI“杠精”自然不會(huì)缺席,經(jīng)過了半年的升級(jí)和準(zhǔn)備,今年它要挑戰(zhàn)的人類辯手是哈利什·納塔拉簡(jiǎn)(Harish Natarajan)。 相比去年的陣容,今年代表人類出戰(zhàn)的小哥來頭似乎更大:
總之就是學(xué)霸+職業(yè)辯手雙重身份,且每個(gè)頭銜含金量都非常高,足夠資格代表人類。 直擊辯論現(xiàn)場(chǎng)辯論規(guī)則很簡(jiǎn)單,開辯前15分鐘現(xiàn)場(chǎng)公布辯題,之前雙方都沒有預(yù)先準(zhǔn)備,兩位辯手也沒有進(jìn)行過任何交流。 15分鐘準(zhǔn)備,開始后各有4分鐘時(shí)間立論,4分鐘時(shí)間反駁對(duì)方觀點(diǎn),最后各有2分鐘結(jié)辯,基本遵循了傳統(tǒng)辯論比賽的規(guī)則。 而決定勝負(fù)的,是由灣區(qū)學(xué)校頂尖辯手和100多名記者組成的現(xiàn)場(chǎng)觀眾評(píng)審,在開場(chǎng)前評(píng)審根據(jù)辯題,投票選擇支持正方還是反方,辯論結(jié)束后再次投票,支持人數(shù)增加的一方獲勝。 隨著主持人最后一句開場(chǎng)語,May the best debater win,雙方辯手出場(chǎng),辯題公布: We should subsidize preschool. 我們應(yīng)該資助幼兒園。 最終持方確定:AI辯手正方,人類代表哈利什持反方。 隨后就是場(chǎng)下評(píng)委投票的環(huán)節(jié),看過辯論賽的朋友都知道,這個(gè)環(huán)節(jié)對(duì)比賽最終勝負(fù)非常重要,因?yàn)閯儇?fù)的關(guān)鍵是“跑票數(shù)”,也就是你能拉到多少票,而投票總?cè)藬?shù)是固定的。 所以初始票數(shù)高的一方,其實(shí)更難贏,因?yàn)槟阈枰獜母俚娜死锢狡?,還要保證自己的初始票都能留住。 我們?cè)賮砜催@道辯題,從通常角度講,加大教育經(jīng)費(fèi)總歸是件好事,而評(píng)委最終投票結(jié)果也符合這一情況: 79%的人同意資助,13%的人不同意資助。 也就意味著這場(chǎng)比賽對(duì)AI來說,好辯,但難贏。這種情況丟到任何一場(chǎng)辯論賽里,都算是大逆風(fēng)開局! 15分鐘準(zhǔn)備結(jié)束,辯論開始。 今年的AI學(xué)壞了,明顯使用了非常規(guī)套路。 一上場(chǎng),立論方向不從經(jīng)濟(jì)角度或可行性出發(fā),直接拋出資助幼兒園的諸多好處:
我的轉(zhuǎn)述比較概括,而AI的原話是:補(bǔ)貼學(xué)前教育,可以幫助打破貧困循環(huán)。 不是跪舔,但這個(gè)觀點(diǎn)是真的復(fù)雜又高級(jí),要讓這個(gè)“貧困循環(huán)”能夠前后閉合,需要大量的數(shù)據(jù)論證和極其嚴(yán)密的邏輯。 這種觀點(diǎn)人類一般不敢使用。 AI則發(fā)揮了整合資料的特長(zhǎng),除了列舉大量相關(guān)數(shù)據(jù),還先后引用了杜克大學(xué)的研究、新澤西州的兒童犯罪案例,甚至還用上了名人名言。 其實(shí)選擇一個(gè)刁鉆的角度立論,還算正常的辯論技巧,但最讓人震驚的是在駁論環(huán)節(jié)最后,AI直接將主題升華,說資助幼兒園還事關(guān)人類基本尊嚴(yán)... 等會(huì)兒,怎么有點(diǎn)耳熟...???
這不就是個(gè)AI版本的陳銘么,先上價(jià)值,再談尊嚴(yán),接下來如果還有時(shí)間,就該宇宙中心呼喚愛了。而陳銘正是用這一技巧,在第5季奇葩說辯論比賽里,幾乎碾壓了所有對(duì)手。 也就是說,在15分鐘的準(zhǔn)備時(shí)間里,除掉梳理觀點(diǎn)、搜集資料、組織語言等常規(guī)行動(dòng)...AI幾乎只用了一瞬的時(shí)間,就參透了當(dāng)下對(duì)于人類最具說服力的話術(shù):談情懷!
我們知道,人類面對(duì)機(jī)器最大的弱點(diǎn)是感性,它不可預(yù)測(cè),也不受理智約束,但凡在談判或辯論中能擊中對(duì)方的情感共鳴點(diǎn),這場(chǎng)博弈幾乎就贏了一半。 但劇情卻遠(yuǎn)比這個(gè)復(fù)雜,可以說AI成也情懷,敗也情懷。 AI立論結(jié)束,人類辯手哈利什表達(dá)觀點(diǎn)。后手發(fā)言的辯手,因?yàn)榭梢愿鶕?jù)對(duì)方觀點(diǎn)直接反駁,也可以最后做總結(jié)陳詞給評(píng)委留下更深的印象,所以在出手順序上人類也占了些便宜。 哈利什抓住了優(yōu)勢(shì),直接反駁AI“拯救貧困”的觀點(diǎn):
所以“拯救貧困”并不成立,而政府資源也有限,不如把錢用在更實(shí)際的地方。 經(jīng)過20分鐘2來2回,雙方結(jié)辯,最終投票結(jié)果正方AI票數(shù)從79%降低到62%,AI丟掉了17%的票數(shù),人類獲勝。 AI為什么會(huì)輸?縱觀整場(chǎng)比賽,其實(shí)人類代表哈利什贏得并不艱難,抓住漏洞,避開查資料不如機(jī)器人的弱項(xiàng),持續(xù)火力攻擊,最終獲得支持票數(shù)。 但AI作為“理智派”代表卻使用了一個(gè)更感性角度,試圖通過人性弱點(diǎn)來說服人類。這個(gè)角度很刁鉆沒錯(cuò),但AI忽略了很重要的一點(diǎn): 人類很難與沒有情感的機(jī)器產(chǎn)生情感共鳴。 情懷由人說出來才叫情懷,由機(jī)器說出來,就有點(diǎn)諷刺了。 但本場(chǎng)人機(jī)辯論最有意思的地方,也同樣是這里,AI的這種感性思維方式,明顯是人類才會(huì)使用的手段,為什么它可以在提前不知道辯題,不知道對(duì)手,也沒有人類干預(yù)的情況下,用了15分鐘琢磨出這種騷套路? 不妨先來看看Project Debater是怎么辯論的。 在剛落幕不就的拉斯維加斯全球消費(fèi)電子展 CES 2019 上,IBM團(tuán)隊(duì)發(fā)布的一個(gè)關(guān)于 Project Debater 的 Demo 就能給我們答案,簡(jiǎn)單講它從拿到觀點(diǎn)到輸出演講稿,分為5步: 首先,判斷觀點(diǎn)。當(dāng)使用者輸入一個(gè)觀點(diǎn),Projict Debater 根據(jù)語義理解,自動(dòng)判斷觀點(diǎn)屬于正方還是反方。
第二,篩選資料。在IBM為它構(gòu)建的數(shù)據(jù)庫中,找到所有可以支持這一觀點(diǎn)的論據(jù),然后判斷論據(jù)的說服力。
這個(gè)判斷標(biāo)準(zhǔn),就來源于IBM從2014年就開始構(gòu)建的數(shù)據(jù)庫,這里面除了各種知識(shí)文獻(xiàn)外,還有一個(gè)非常關(guān)鍵的內(nèi)容,就是觀點(diǎn)在社會(huì)中的反響。 這其中可能包括專家發(fā)言,民意調(diào)查,辯論賽數(shù)據(jù)等等可以反映觀點(diǎn)說服力的數(shù)據(jù)。 這也是為什么 Project Debater 可以在15分鐘內(nèi)想出談情懷這種套路,因?yàn)樗恍枰獛酌刖湍軓臄?shù)據(jù)集中發(fā)現(xiàn)用這種方法說服人類,總是奏效的。
找到了最有力的論點(diǎn),再找到可以支持論點(diǎn)最合適的論據(jù),接下來就是去重、排列組合,最終形成辯論整體邏輯,也就是決定先說哪個(gè),后說哪個(gè),怎么去說,效果更好。
然后就到了最后一步,把這些變成一篇演講稿,并且要用人說話的方式,比如增加開場(chǎng)白,文中增加轉(zhuǎn)折、過渡語句,在需要的時(shí)候再來點(diǎn)俏皮話或者金句,抓住觀眾注意力。
這里涉及到了自然語言識(shí)別,語義理解等AI領(lǐng)域技術(shù),這在幾年前幾乎沒有哪個(gè)科技公司能做到,這一步對(duì)AI來說也是最艱難的一步,但 Project Debater 很顯然已經(jīng)可以做到。 看到這里其實(shí)我們就能發(fā)現(xiàn),做到了這些的AI,幾乎不可能辯輸。 因?yàn)檗q論最困難的部分,找論點(diǎn),找論據(jù),組織更有邏輯甚至更優(yōu)雅的語言,對(duì) Project Debater 來說都是小菜一碟。但這次比賽之所以會(huì)輸,拋開持方和先后發(fā)言這些因素,我認(rèn)為更重要的原因是表達(dá)者不是活人,而是一塊兒液晶顯示器。 是不是聽起來很荒誕,就像前面說過的,人類的選擇總是充滿感性色彩。 沒有感情,是件壞事嗎《奇葩說》第五季中馬東說過一個(gè)數(shù)據(jù):這檔辯論綜藝節(jié)目辦了4年,做過幾十場(chǎng)辯論比賽,來過數(shù)不清的內(nèi)陸、香港、臺(tái)灣、新加坡專業(yè)辯手,但在收視大數(shù)據(jù)統(tǒng)計(jì)中,收視峰值卻來自于一名非專業(yè)辯手,歐陽超。 引經(jīng)據(jù)典的專業(yè)辯手那么多,而連上場(chǎng)次數(shù)都屈指可數(shù)的非專業(yè)辯手之所以能獲得最高收視,正是因?yàn)樗幸惶转?dú)特的辯論風(fēng)格。 這位人民警察幾乎每次出場(chǎng),都能極好地把控現(xiàn)場(chǎng)情緒,用最匪夷所思的語言和動(dòng)作,讓全場(chǎng)沸騰。 換個(gè)角度看,有情緒的表達(dá)觀點(diǎn)是人類的優(yōu)勢(shì),對(duì)于辯論這項(xiàng)活動(dòng)本身來說,這也是一名辯手必不可少的要素。 但對(duì)于真理的探究和思考,甚至是決策的討論來說,理性客觀才是最重要的衡量標(biāo)準(zhǔn)。 如果在這場(chǎng)人機(jī)辯論賽中,AI的觀點(diǎn)換成真人有感情地表達(dá),或者哈利什的觀點(diǎn)換成機(jī)器發(fā)音,再或者讓評(píng)委通過相同的發(fā)音判斷觀點(diǎn),是否比賽會(huì)有不一樣的結(jié)果?
(去年的辯論賽現(xiàn)場(chǎng),Project Debater贏得了一場(chǎng)勝利) 因?yàn)?nbsp;聲音“太理性”輸?shù)袅吮荣?,但也是這份理性給了辯論AI存在的意義,這才是IBM研發(fā)這個(gè)AI的初衷。 會(huì)辯論的AI有什么用作為AI領(lǐng)域的開山鼻祖,IBM從1962年展示了全球第首個(gè)語音識(shí)別設(shè)備Shoebox,到1997年的深藍(lán)系統(tǒng)在國際象棋中戰(zhàn)勝人類,再到2001年的沃森系統(tǒng)在美國老牌智力問答節(jié)目中贏得100萬美元獎(jiǎng)金... 直到2014年開始研發(fā)辯論AI系統(tǒng),IBM費(fèi)這么大功夫搞出Project Debater,可不是為了跟人抬抬杠打打比賽這么簡(jiǎn)單。 這套辯論AI系統(tǒng)通過強(qiáng)大的語義理解和語言生成能力,最直接的應(yīng)用領(lǐng)域就是凈化網(wǎng)絡(luò)環(huán)境、輔助語言學(xué)習(xí),以及徹底改變?nèi)藱C(jī)交互方式。 但更重要的意義在于,它能通過不斷提升數(shù)據(jù)處理能力,幫助醫(yī)生、投資人、律師、甚至執(zhí)法機(jī)關(guān)和政府,在做出重要決策時(shí)提供最客觀、理性、無人性偏頗、無情緒左右的建議! 這其中的價(jià)值,可遠(yuǎn)超一場(chǎng)比賽的勝負(fù)。 所以,如果這才是辯論AI真正的“情懷”,那即使未來技術(shù)成熟到可以模擬更具情感的聲音,相信IBM團(tuán)隊(duì)也不會(huì)實(shí)裝,否則就真成了為辯論而生,到辯論為止了。 除此之外,Project Debater 還有一個(gè)我認(rèn)為的“隱藏功能”:模擬人類困境,也就是通過獨(dú)特的知識(shí)圖譜來模擬人類即將遇到的矛盾和困境。 再回頭看,是不是發(fā)現(xiàn)這場(chǎng)比賽中它提出的“資助幼兒園事關(guān)人類尊嚴(yán)”,也是模擬人類困境的結(jié)果? 至于這套算法更深層的邏輯,或許只有IBM的研發(fā)核心成員才知道,但我們至少能明確一點(diǎn):從處理現(xiàn)有資料到模擬未知的事情,是AI技術(shù)進(jìn)化的關(guān)鍵。 去年的辯論賽上,Project Debater 在談到“是否應(yīng)該加大遠(yuǎn)距離醫(yī)療技術(shù)的使用”這道辯題時(shí),開場(chǎng)便說:
緊接著它又用很惋惜的口吻說:
這話聽起來是不是除了更像人,也更有自己的立場(chǎng)? (圖自:The New York Times) 但現(xiàn)實(shí)還是殘酷的,我們看到的所有“機(jī)器獨(dú)立意識(shí)”,都只是程序員根據(jù)人類模擬出的假象,目前人工智能技術(shù)的極限還只是“解決特定問題”。 而辯論AI的誕生,代表著IBM在嘗試教會(huì)機(jī)器該如何思考,先模仿人類角度去思考,再嘗試從自己的立場(chǎng)去思考。 現(xiàn)在看來已經(jīng)完成了第一步,但在我們自己都還沒搞清楚意識(shí)是什么,以及意識(shí)存在形式的時(shí)候,談第二步還為時(shí)過早。 不過畢竟是IBM,自信如常,他們?cè)?Project Debater 官網(wǎng)底部一直留著這么句話: 辯論,只是一個(gè)開始。 |
|