人機(jī)第二次世紀(jì)辯論，AI輸了

鱷魚與豬 2019-02-16

展開全文

「創(chuàng)業(yè)最前線」旗下「科技最前線」原創(chuàng)出品

作者 | 北行三

戰(zhàn)火升級(jí)

才半年不見，Project Debater就學(xué)壞了。

2019年2月11日，AI和人類冠軍辯手在舊金山進(jìn)行了史上第二次人機(jī)辯論賽，第一次的主角也是它，IBM研發(fā)的人工智能：Project Debater。

（Project Debater）

很難想象，眼前這塊像液晶廣告牌一樣的東西就是IBM目前在AI領(lǐng)域最新的研發(fā)成果，而它最擅長(zhǎng)的事，就是跟人類“抬杠”。

去年的6月的人機(jī)辯論首戰(zhàn)，它的兩個(gè)對(duì)手都是來自以色列的頂級(jí)辯論專家，最終戰(zhàn)績(jī)1勝1負(fù)。

今年在IBM的Think 2019大會(huì)上，這位AI“杠精”自然不會(huì)缺席，經(jīng)過了半年的升級(jí)和準(zhǔn)備，今年它要挑戰(zhàn)的人類辯手是哈利什·納塔拉簡(jiǎn)（Harish Natarajan）。

相比去年的陣容，今年代表人類出戰(zhàn)的小哥來頭似乎更大：

2012年歐洲辯論賽冠軍，牛津政治、哲學(xué)、經(jīng)濟(jì)本科，劍橋哲學(xué)和國際關(guān)系碩士，英國前首相卡梅倫的學(xué)弟，現(xiàn)任AKE咨詢公司的經(jīng)濟(jì)風(fēng)險(xiǎn)主管，得過的世界級(jí)辯論獎(jiǎng)數(shù)不清了，還擁有多項(xiàng)辯論世界紀(jì)錄。

總之就是學(xué)霸+職業(yè)辯手雙重身份，且每個(gè)頭銜含金量都非常高，足夠資格代表人類。

直擊辯論現(xiàn)場(chǎng)

辯論規(guī)則很簡(jiǎn)單，開辯前15分鐘現(xiàn)場(chǎng)公布辯題，之前雙方都沒有預(yù)先準(zhǔn)備，兩位辯手也沒有進(jìn)行過任何交流。

15分鐘準(zhǔn)備，開始后各有4分鐘時(shí)間立論，4分鐘時(shí)間反駁對(duì)方觀點(diǎn)，最后各有2分鐘結(jié)辯，基本遵循了傳統(tǒng)辯論比賽的規(guī)則。

而決定勝負(fù)的，是由灣區(qū)學(xué)校頂尖辯手和100多名記者組成的現(xiàn)場(chǎng)觀眾評(píng)審，在開場(chǎng)前評(píng)審根據(jù)辯題，投票選擇支持正方還是反方，辯論結(jié)束后再次投票，支持人數(shù)增加的一方獲勝。

隨著主持人最后一句開場(chǎng)語，May the best debater win，雙方辯手出場(chǎng)，辯題公布：

We should subsidize preschool.

我們應(yīng)該資助幼兒園。

最終持方確定：AI辯手正方，人類代表哈利什持反方。

隨后就是場(chǎng)下評(píng)委投票的環(huán)節(jié)，看過辯論賽的朋友都知道，這個(gè)環(huán)節(jié)對(duì)比賽最終勝負(fù)非常重要，因?yàn)閯儇?fù)的關(guān)鍵是“跑票數(shù)”，也就是你能拉到多少票，而投票總?cè)藬?shù)是固定的。

所以初始票數(shù)高的一方，其實(shí)更難贏，因?yàn)槟阈枰獜母俚娜死锢狡?，還要保證自己的初始票都能留住。

我們?cè)賮砜催@道辯題，從通常角度講，加大教育經(jīng)費(fèi)總歸是件好事，而評(píng)委最終投票結(jié)果也符合這一情況：

79%的人同意資助，13%的人不同意資助。

也就意味著這場(chǎng)比賽對(duì)AI來說，好辯，但難贏。這種情況丟到任何一場(chǎng)辯論賽里，都算是大逆風(fēng)開局！

15分鐘準(zhǔn)備結(jié)束，辯論開始。

今年的AI學(xué)壞了，明顯使用了非常規(guī)套路。

一上場(chǎng)，立論方向不從經(jīng)濟(jì)角度或可行性出發(fā)，直接拋出資助幼兒園的諸多好處：

可以幫兒童擺脫貧窮，還能幫助發(fā)展后續(xù)學(xué)業(yè)，最終還能節(jié)約醫(yī)療開支、降低兒童犯罪率。

我的轉(zhuǎn)述比較概括，而AI的原話是：補(bǔ)貼學(xué)前教育，可以幫助打破貧困循環(huán)。

不是跪舔，但這個(gè)觀點(diǎn)是真的復(fù)雜又高級(jí)，要讓這個(gè)“貧困循環(huán)”能夠前后閉合，需要大量的數(shù)據(jù)論證和極其嚴(yán)密的邏輯。

這種觀點(diǎn)人類一般不敢使用。

AI則發(fā)揮了整合資料的特長(zhǎng)，除了列舉大量相關(guān)數(shù)據(jù)，還先后引用了杜克大學(xué)的研究、新澤西州的兒童犯罪案例，甚至還用上了名人名言。

其實(shí)選擇一個(gè)刁鉆的角度立論，還算正常的辯論技巧，但最讓人震驚的是在駁論環(huán)節(jié)最后，AI直接將主題升華，說資助幼兒園還事關(guān)人類基本尊嚴(yán)...

等會(huì)兒，怎么有點(diǎn)耳熟...？？？

GIF

這不就是個(gè)AI版本的陳銘么，先上價(jià)值，再談尊嚴(yán)，接下來如果還有時(shí)間，就該宇宙中心呼喚愛了。而陳銘正是用這一技巧，在第5季奇葩說辯論比賽里，幾乎碾壓了所有對(duì)手。

也就是說，在15分鐘的準(zhǔn)備時(shí)間里，除掉梳理觀點(diǎn)、搜集資料、組織語言等常規(guī)行動(dòng)...AI幾乎只用了一瞬的時(shí)間，就參透了當(dāng)下對(duì)于人類最具說服力的話術(shù)：談情懷！

GIF

我們知道，人類面對(duì)機(jī)器最大的弱點(diǎn)是感性，它不可預(yù)測(cè)，也不受理智約束，但凡在談判或辯論中能擊中對(duì)方的情感共鳴點(diǎn)，這場(chǎng)博弈幾乎就贏了一半。

但劇情卻遠(yuǎn)比這個(gè)復(fù)雜，可以說AI成也情懷，敗也情懷。

AI立論結(jié)束，人類辯手哈利什表達(dá)觀點(diǎn)。后手發(fā)言的辯手，因?yàn)榭梢愿鶕?jù)對(duì)方觀點(diǎn)直接反駁，也可以最后做總結(jié)陳詞給評(píng)委留下更深的印象，所以在出手順序上人類也占了些便宜。

哈利什抓住了優(yōu)勢(shì)，直接反駁AI“拯救貧困”的觀點(diǎn)：

第一，愿望是美好的，但現(xiàn)實(shí)很殘酷，政府資助了幼兒園實(shí)際只是資助了本來就要送孩子上幼兒園的那些人，并不能資助到最貧窮的人。

第二，資助幼兒園帶來的各種好處只是AI的推論，而且即使能實(shí)現(xiàn)，也不是窮人能享受到的，最終受益人還是本來就有幼兒園上的那些人。

所以“拯救貧困”并不成立，而政府資源也有限，不如把錢用在更實(shí)際的地方。

經(jīng)過20分鐘2來2回，雙方結(jié)辯，最終投票結(jié)果正方AI票數(shù)從79%降低到62%，AI丟掉了17%的票數(shù)，人類獲勝。

AI為什么會(huì)輸？

縱觀整場(chǎng)比賽，其實(shí)人類代表哈利什贏得并不艱難，抓住漏洞，避開查資料不如機(jī)器人的弱項(xiàng)，持續(xù)火力攻擊，最終獲得支持票數(shù)。

但AI作為“理智派”代表卻使用了一個(gè)更感性角度，試圖通過人性弱點(diǎn)來說服人類。這個(gè)角度很刁鉆沒錯(cuò)，但AI忽略了很重要的一點(diǎn)：

人類很難與沒有情感的機(jī)器產(chǎn)生情感共鳴。

情懷由人說出來才叫情懷，由機(jī)器說出來，就有點(diǎn)諷刺了。

但本場(chǎng)人機(jī)辯論最有意思的地方，也同樣是這里，AI的這種感性思維方式，明顯是人類才會(huì)使用的手段，為什么它可以在提前不知道辯題，不知道對(duì)手，也沒有人類干預(yù)的情況下，用了15分鐘琢磨出這種騷套路？

不妨先來看看Project Debater是怎么辯論的。

在剛落幕不就的拉斯維加斯全球消費(fèi)電子展 CES 2019 上，IBM團(tuán)隊(duì)發(fā)布的一個(gè)關(guān)于 Project Debater 的 Demo 就能給我們答案，簡(jiǎn)單講它從拿到觀點(diǎn)到輸出演講稿，分為5步：

首先，判斷觀點(diǎn)。當(dāng)使用者輸入一個(gè)觀點(diǎn)，Projict Debater 根據(jù)語義理解，自動(dòng)判斷觀點(diǎn)屬于正方還是反方。

GIF

第二，篩選資料。在IBM為它構(gòu)建的數(shù)據(jù)庫中，找到所有可以支持這一觀點(diǎn)的論據(jù)，然后判斷論據(jù)的說服力。

GIF

這個(gè)判斷標(biāo)準(zhǔn)，就來源于IBM從2014年就開始構(gòu)建的數(shù)據(jù)庫，這里面除了各種知識(shí)文獻(xiàn)外，還有一個(gè)非常關(guān)鍵的內(nèi)容，就是觀點(diǎn)在社會(huì)中的反響。

這其中可能包括專家發(fā)言，民意調(diào)查，辯論賽數(shù)據(jù)等等可以反映觀點(diǎn)說服力的數(shù)據(jù)。

這也是為什么 Project Debater 可以在15分鐘內(nèi)想出談情懷這種套路，因?yàn)樗恍枰獛酌刖湍軓臄?shù)據(jù)集中發(fā)現(xiàn)用這種方法說服人類，總是奏效的。

GIF

找到了最有力的論點(diǎn)，再找到可以支持論點(diǎn)最合適的論據(jù)，接下來就是去重、排列組合，最終形成辯論整體邏輯，也就是決定先說哪個(gè)，后說哪個(gè)，怎么去說，效果更好。

GIF

然后就到了最后一步，把這些變成一篇演講稿，并且要用人說話的方式，比如增加開場(chǎng)白，文中增加轉(zhuǎn)折、過渡語句，在需要的時(shí)候再來點(diǎn)俏皮話或者金句，抓住觀眾注意力。

GIF

這里涉及到了自然語言識(shí)別，語義理解等AI領(lǐng)域技術(shù)，這在幾年前幾乎沒有哪個(gè)科技公司能做到，這一步對(duì)AI來說也是最艱難的一步，但 Project Debater 很顯然已經(jīng)可以做到。

看到這里其實(shí)我們就能發(fā)現(xiàn)，做到了這些的AI，幾乎不可能辯輸。

因?yàn)檗q論最困難的部分，找論點(diǎn)，找論據(jù)，組織更有邏輯甚至更優(yōu)雅的語言，對(duì) Project Debater 來說都是小菜一碟。但這次比賽之所以會(huì)輸，拋開持方和先后發(fā)言這些因素，我認(rèn)為更重要的原因是表達(dá)者不是活人，而是一塊兒液晶顯示器。

是不是聽起來很荒誕，就像前面說過的，人類的選擇總是充滿感性色彩。

沒有感情，是件壞事嗎

《奇葩說》第五季中馬東說過一個(gè)數(shù)據(jù)：這檔辯論綜藝節(jié)目辦了4年，做過幾十場(chǎng)辯論比賽，來過數(shù)不清的內(nèi)陸、香港、臺(tái)灣、新加坡專業(yè)辯手，但在收視大數(shù)據(jù)統(tǒng)計(jì)中，收視峰值卻來自于一名非專業(yè)辯手，歐陽超。

引經(jīng)據(jù)典的專業(yè)辯手那么多，而連上場(chǎng)次數(shù)都屈指可數(shù)的非專業(yè)辯手之所以能獲得最高收視，正是因?yàn)樗幸惶转?dú)特的辯論風(fēng)格。

這位人民警察幾乎每次出場(chǎng)，都能極好地把控現(xiàn)場(chǎng)情緒，用最匪夷所思的語言和動(dòng)作，讓全場(chǎng)沸騰。

換個(gè)角度看，有情緒的表達(dá)觀點(diǎn)是人類的優(yōu)勢(shì)，對(duì)于辯論這項(xiàng)活動(dòng)本身來說，這也是一名辯手必不可少的要素。

但對(duì)于真理的探究和思考，甚至是決策的討論來說，理性客觀才是最重要的衡量標(biāo)準(zhǔn)。

如果在這場(chǎng)人機(jī)辯論賽中，AI的觀點(diǎn)換成真人有感情地表達(dá)，或者哈利什的觀點(diǎn)換成機(jī)器發(fā)音，再或者讓評(píng)委通過相同的發(fā)音判斷觀點(diǎn)，是否比賽會(huì)有不一樣的結(jié)果？

GIF

（去年的辯論賽現(xiàn)場(chǎng)，Project Debater贏得了一場(chǎng)勝利）

因?yàn)?nbsp;聲音“太理性”輸?shù)袅吮荣?，但也是這份理性給了辯論AI存在的意義，這才是IBM研發(fā)這個(gè)AI的初衷。

會(huì)辯論的AI有什么用

作為AI領(lǐng)域的開山鼻祖，IBM從1962年展示了全球第首個(gè)語音識(shí)別設(shè)備Shoebox，到1997年的深藍(lán)系統(tǒng)在國際象棋中戰(zhàn)勝人類，再到2001年的沃森系統(tǒng)在美國老牌智力問答節(jié)目中贏得100萬美元獎(jiǎng)金...

直到2014年開始研發(fā)辯論AI系統(tǒng)，IBM費(fèi)這么大功夫搞出Project Debater，可不是為了跟人抬抬杠打打比賽這么簡(jiǎn)單。

這套辯論AI系統(tǒng)通過強(qiáng)大的語義理解和語言生成能力，最直接的應(yīng)用領(lǐng)域就是凈化網(wǎng)絡(luò)環(huán)境、輔助語言學(xué)習(xí)，以及徹底改變?nèi)藱C(jī)交互方式。

但更重要的意義在于，它能通過不斷提升數(shù)據(jù)處理能力，幫助醫(yī)生、投資人、律師、甚至執(zhí)法機(jī)關(guān)和政府，在做出重要決策時(shí)提供最客觀、理性、無人性偏頗、無情緒左右的建議！

這其中的價(jià)值，可遠(yuǎn)超一場(chǎng)比賽的勝負(fù)。

所以，如果這才是辯論AI真正的“情懷”，那即使未來技術(shù)成熟到可以模擬更具情感的聲音，相信IBM團(tuán)隊(duì)也不會(huì)實(shí)裝，否則就真成了為辯論而生，到辯論為止了。

除此之外，Project Debater 還有一個(gè)我認(rèn)為的“隱藏功能”：模擬人類困境，也就是通過獨(dú)特的知識(shí)圖譜來模擬人類即將遇到的矛盾和困境。

再回頭看，是不是發(fā)現(xiàn)這場(chǎng)比賽中它提出的“資助幼兒園事關(guān)人類尊嚴(yán)”，也是模擬人類困境的結(jié)果？

至于這套算法更深層的邏輯，或許只有IBM的研發(fā)核心成員才知道，但我們至少能明確一點(diǎn)：從處理現(xiàn)有資料到模擬未知的事情，是AI技術(shù)進(jìn)化的關(guān)鍵。

去年的辯論賽上，Project Debater 在談到“是否應(yīng)該加大遠(yuǎn)距離醫(yī)療技術(shù)的使用”這道辯題時(shí)，開場(chǎng)便說：

“今天有許多利害攸關(guān)的事情，對(duì)我來說尤其如此。”

緊接著它又用很惋惜的口吻說：

“我不能說自己‘熱血沸騰’，因?yàn)槲覜]有血液。”

這話聽起來是不是除了更像人，也更有自己的立場(chǎng)？

（圖自：The New York Times）

但現(xiàn)實(shí)還是殘酷的，我們看到的所有“機(jī)器獨(dú)立意識(shí)”，都只是程序員根據(jù)人類模擬出的假象，目前人工智能技術(shù)的極限還只是“解決特定問題”。

而辯論AI的誕生，代表著IBM在嘗試教會(huì)機(jī)器該如何思考，先模仿人類角度去思考，再嘗試從自己的立場(chǎng)去思考。

現(xiàn)在看來已經(jīng)完成了第一步，但在我們自己都還沒搞清楚意識(shí)是什么，以及意識(shí)存在形式的時(shí)候，談第二步還為時(shí)過早。

不過畢竟是IBM，自信如常，他們?cè)?Project Debater 官網(wǎng)底部一直留著這么句話：

辯論，只是一個(gè)開始。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：鱷魚與豬 > 《文件夾1》

舉報(bào)/認(rèn)領(lǐng)