大家好,我是來(lái)自硅谷工程師屈直。 要說(shuō)近期關(guān)于人工智能的大事件,大概要說(shuō)曾經(jīng)叱咤棋壇的Alpha go,被升級(jí)版的Alpha zero以0比100擊敗的新聞了吧。人類第一棋手柯潔“抱定必死信念”的豪言壯語(yǔ)尚在耳邊,沒(méi)想到令其飲恨的“大魔王”,這么快就被另一個(gè)“大魔王”打倒了,這真是有點(diǎn)高手過(guò)招,后浪把前浪拍死在沙灘上的意思。 今日內(nèi)容聚焦 1.“第一棋手”柯潔被alpha go打敗是否意味著一種機(jī)器人終將勝過(guò)人類的前兆呢? 2. 圍棋要比國(guó)際象棋復(fù)雜多少? 3. 國(guó)際象棋最強(qiáng)大腦“深藍(lán)”由何組成? 當(dāng)初“第一棋手”柯潔被alpha go打敗,“機(jī)器人超越人腦”,似乎成了定局。網(wǎng)上一片哀鴻遍野,什么“震驚!人類要被機(jī)器人統(tǒng)治了”之類的言論也是傳得滿天飛。為什么大家的反應(yīng)這么大呢?因?yàn)樵诖蠹业挠∠笾?,能把棋類運(yùn)動(dòng)玩出成績(jī)的,應(yīng)該都是些擁有“超級(jí)大腦”極其聰明的人?,F(xiàn)在柯潔、李世石這些“棋圣”竟然在自己最聰明的領(lǐng)域被人工智能擊敗了,這怎能不叫人心生不安?AI在棋類游戲領(lǐng)域?qū)θ四X的“智商壓制”,是否意味著一種機(jī)器人終將勝過(guò)人類的前兆呢? 事實(shí)上人類在棋類運(yùn)動(dòng)中被機(jī)器擊敗,這并不是第一次。本講中,我就帶領(lǐng)大家看看上個(gè)世紀(jì)人類棋手和計(jì)算機(jī)的交鋒。 時(shí)間回到北京時(shí)間 1997 年 5 月 11 日的清晨,在與一臺(tái)名為“深藍(lán)”的電腦對(duì)弈的最后一局中,人類有史以來(lái)最偉大的國(guó)際象棋大師卡斯帕羅夫面帶沮喪,不得不舉了白旗。這場(chǎng)舉世矚目的人機(jī)大戰(zhàn)以計(jì)算機(jī)取勝而落下帷幕,國(guó)際象棋領(lǐng)域的“最強(qiáng)大腦”輸給了計(jì)算機(jī)。而就在一年前,他還曾經(jīng)在另一場(chǎng)比賽中擊敗“深藍(lán)”,拿到40萬(wàn)美金獎(jiǎng)金。沒(méi)想到士別三日,刮目相待。 跟如今的alpha go、alpha zero不同,這個(gè)“深藍(lán)”可是一個(gè)大家伙,它的外表就像一個(gè)黑色的大柜子,重達(dá)1.4噸,有32個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有8塊專門為進(jìn)行國(guó)際象棋對(duì)弈設(shè)計(jì)的處理器,共計(jì)256塊這樣的處理器,集成在IBM的并行運(yùn)算系統(tǒng)中,從而擁有了每秒超過(guò)兩億步的計(jì)算速度。這是一個(gè)很簡(jiǎn)單粗暴的邏輯:既然我不會(huì)思考,也沒(méi)有什么直覺可言,那我就只要通過(guò)超人的計(jì)算速度,把棋盤上可能出現(xiàn)的每一種可能性都算一遍就可以了——這就是深藍(lán)算法的核心,暴力窮舉。嚴(yán)格來(lái)講,這還并不是人工智能,只是在硬件上的強(qiáng)大而已。 “深藍(lán)”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評(píng)估模塊,以及搜索控制器。這三個(gè)部分,都是為了“優(yōu)化運(yùn)算速度”這一終極目標(biāo)而服務(wù)的。 其中需要說(shuō)一下的是占據(jù)了深藍(lán)“大腦”三分之二面積的評(píng)估模塊。它主要分三個(gè)部分。 首先是棋子位置評(píng)估。它采用的模式是在每一步后對(duì)盤面上所有棋子當(dāng)前所處的位置計(jì)分,不同棋子處于不同位置的分值都被事先計(jì)算好并寫入硬件,在實(shí)戰(zhàn)中,它會(huì)靈活的適用當(dāng)前局面下得分較高的走法。為了簡(jiǎn)化計(jì)算,IBM團(tuán)隊(duì)還根據(jù)大量的大師級(jí)棋譜,向“深藍(lán)”輸入了8000多種行棋模式,這就更加簡(jiǎn)化了計(jì)算的過(guò)程。 然后是殘局評(píng)估。IBM研制小組向“深藍(lán)”輸入了100年來(lái)所有國(guó)際特級(jí)大師開局和殘局的下法,這就使它能夠在一些時(shí)候直接參考?xì)v史上大師們的下法,從而減少計(jì)算量。 最后是慢速評(píng)估。它牽涉的主要是一些國(guó)際象棋的特殊指標(biāo),比如局面的結(jié)構(gòu),個(gè)人的棋風(fēng)這一類“看不見摸不著”的東西。當(dāng)然,這些所謂的“特殊指標(biāo)”終究也是反映在棋盤上的。深藍(lán)就可以憑這種評(píng)估方法,在全局上進(jìn)行自我調(diào)整。 事實(shí)上,卡斯帕羅夫在與“深藍(lán)”對(duì)奕時(shí),就采用了一些“出奇制勝”的策略。他故意在開局中用出和尋常棋路大相徑庭的“怪招”來(lái)干擾“深藍(lán)”的棋路。然而,“深藍(lán)”迅速拋開了那些“套路”,用非人的計(jì)算速度碾壓了卡斯帕羅夫。 當(dāng)年這個(gè)事情出來(lái)以后,人們確實(shí)有些“機(jī)器比人強(qiáng)”的擔(dān)憂,不過(guò)心里不禁還有一線希望——因?yàn)槲覀冞€有圍棋。國(guó)際象棋只是一個(gè)8乘8的格子,每一步只有35種可能,每一盤棋80回合,就算加上各種變量,這個(gè)數(shù)量對(duì)于計(jì)算機(jī)來(lái)講也實(shí)在不算大。比如“深藍(lán)”可以算到每一步之后12步棋的信息,而人類最強(qiáng)的棋手也只能做到10步。這就和跟開了掛的選手比賽一樣,輸是很正常的。 那圍棋就復(fù)雜的多了,用“深藍(lán)”的方式肯定無(wú)法取勝。它每步有250種可能,一局棋可以長(zhǎng)達(dá)150回合。這就不是憑借“粗暴”的計(jì)算,蠻力的“強(qiáng)記”,以“固定”的程序邏輯決策,或窮極所有可能性進(jìn)行篩選就可以勝任的了。這導(dǎo)致人類一直相信,再?gòu)?qiáng)大的機(jī)器人也是沒(méi)有辦法對(duì)抗咱們的國(guó)粹。但是隨著阿爾法狗出現(xiàn),它很快就讓我們無(wú)言了,然后留給我們一連串的興奮與憂傷。 說(shuō)到興奮,圍棋問(wèn)題與現(xiàn)實(shí)生活中的問(wèn)題是相通的,國(guó)人甚至將“博弈”圍棋視為洞悉人性、參悟人生的過(guò)程。然而,現(xiàn)在下圍棋的卻是一個(gè)機(jī)器,意味著這個(gè)機(jī)器除擁有超強(qiáng)的記憶能力、邏輯思維能力,還要擁有創(chuàng)造力甚至個(gè)性。 柯潔就曾這樣贊嘆過(guò)AlphaGo的“棋風(fēng)”:“感覺就像一個(gè)有血有肉的人在下棋一樣,該棄的地方也會(huì)棄,該退出的地方也會(huì)退出,非常均衡的一個(gè)棋風(fēng),真是看不出出自程序之手?!?nbsp;AlphaGo有好幾次落子極其“非常規(guī)”,許多專業(yè)棋手都表示“看不懂”。而聶衛(wèi)平甚至表示自己想要對(duì)AlphaGo的“驚人一手”脫帽致敬,因?yàn)樗坝貌豢伤甲h的下法辟立了圍棋常識(shí)之外的新天地”。也就是說(shuō),這不是AlphaGo從既往棋局中“復(fù)制”過(guò)來(lái)的,而是自己“創(chuàng)造”的戰(zhàn)術(shù)打法。 這個(gè)AlphaGo的最主要工作原理,就是近幾年人工智能領(lǐng)域最為熱門,也是我們?cè)谥敖?jīng)常提到的“深度學(xué)習(xí)”,通過(guò)模仿人類大腦神經(jīng)網(wǎng)絡(luò),讓機(jī)器模擬人腦的機(jī)制進(jìn)行記憶、學(xué)習(xí)、分析、思維,還有創(chuàng)造……這一部分,我將在下一講當(dāng)中,為大家另作介紹。 今天,我主要帶大家回望了一下20年前的“人機(jī)大戰(zhàn)”。從“深藍(lán)”到“阿爾法狗”,人類科技的進(jìn)化史,似乎也是一個(gè)人們不斷立flag、又不斷被機(jī)器“吊打”的過(guò)程。不過(guò)這其中突破性的歷史意義,早已超越勝負(fù)。因?yàn)樵谖磥?lái),人工智能肯定不單純會(huì)用來(lái)下棋,像我們前面所講,以及后面會(huì)繼續(xù)為大家講的那樣,它會(huì)掀起各個(gè)領(lǐng)域的產(chǎn)業(yè)變革、經(jīng)濟(jì)變革,甚至是社會(huì)變革。 知識(shí)清單 1. 事實(shí)上人類在棋類運(yùn)動(dòng)中被機(jī)器擊敗,AlphaGo并不是第一次。 2. AlphaGo最主要工作原理,就是近幾年人工智能領(lǐng)域最為熱門的“深度學(xué)習(xí)” 3.“深藍(lán)”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評(píng)估模塊,以及搜索控制器。 今日思考 不過(guò)回到棋牌類這個(gè)小小的領(lǐng)域,大師們研究棋譜、與人實(shí)戰(zhàn)好幾千年,又從中參悟到了那么人生哲理和自然規(guī)律,可以說(shuō)是源遠(yuǎn)流長(zhǎng)了,沒(méi)成想?yún)s被機(jī)器人打敗。如果換做你的話,如果你所玩的游戲中的“最強(qiáng)玩家”被機(jī)器擊敗,這會(huì)影響從這個(gè)游戲中尋找快樂(lè)的動(dòng)力嗎?你對(duì)“人類最強(qiáng)大腦被機(jī)器人擊敗”這件事怎么看呢? 歡迎把你的見解在評(píng)論區(qū)與我們分享。我是屈直,我們下期再見。
知之×世界說(shuō)重磅推出知識(shí)付費(fèi)課程:輸?shù)舻奈磥?lái) 掃描下方二維碼,《輸?shù)舻奈磥?lái)》更多精彩內(nèi)容盡在“知之”微信公眾號(hào) |
|