二十年前一場(chǎng)人機(jī)大戰(zhàn)預(yù)示了未來(lái)？

老工匠心隨天地 2018-01-29

展開全文

大家好，我是來(lái)自硅谷工程師屈直。

要說(shuō)近期關(guān)于人工智能的大事件，大概要說(shuō)曾經(jīng)叱咤棋壇的Alpha go，被升級(jí)版的Alpha zero以0比100擊敗的新聞了吧。人類第一棋手柯潔“抱定必死信念”的豪言壯語(yǔ)尚在耳邊，沒(méi)想到令其飲恨的“大魔王”，這么快就被另一個(gè)“大魔王”打倒了，這真是有點(diǎn)高手過(guò)招，后浪把前浪拍死在沙灘上的意思。

今日內(nèi)容聚焦

1.“第一棋手”柯潔被alpha go打敗是否意味著一種機(jī)器人終將勝過(guò)人類的前兆呢？

2. 圍棋要比國(guó)際象棋復(fù)雜多少？

3. 國(guó)際象棋最強(qiáng)大腦“深藍(lán)”由何組成？

當(dāng)初“第一棋手”柯潔被alpha go打敗，“機(jī)器人超越人腦”，似乎成了定局。網(wǎng)上一片哀鴻遍野，什么“震驚！人類要被機(jī)器人統(tǒng)治了”之類的言論也是傳得滿天飛。為什么大家的反應(yīng)這么大呢？因?yàn)樵诖蠹业挠∠笾?，能把棋類運(yùn)動(dòng)玩出成績(jī)的，應(yīng)該都是些擁有“超級(jí)大腦”極其聰明的人?，F(xiàn)在柯潔、李世石這些“棋圣”竟然在自己最聰明的領(lǐng)域被人工智能擊敗了，這怎能不叫人心生不安？AI在棋類游戲領(lǐng)域?qū)θ四X的“智商壓制”，是否意味著一種機(jī)器人終將勝過(guò)人類的前兆呢？

事實(shí)上人類在棋類運(yùn)動(dòng)中被機(jī)器擊敗，這并不是第一次。本講中，我就帶領(lǐng)大家看看上個(gè)世紀(jì)人類棋手和計(jì)算機(jī)的交鋒。

時(shí)間回到北京時(shí)間 1997 年 5 月 11 日的清晨，在與一臺(tái)名為“深藍(lán)”的電腦對(duì)弈的最后一局中，人類有史以來(lái)最偉大的國(guó)際象棋大師卡斯帕羅夫面帶沮喪，不得不舉了白旗。這場(chǎng)舉世矚目的人機(jī)大戰(zhàn)以計(jì)算機(jī)取勝而落下帷幕，國(guó)際象棋領(lǐng)域的“最強(qiáng)大腦”輸給了計(jì)算機(jī)。而就在一年前，他還曾經(jīng)在另一場(chǎng)比賽中擊敗“深藍(lán)”，拿到40萬(wàn)美金獎(jiǎng)金。沒(méi)想到士別三日，刮目相待。

跟如今的alpha go、alpha zero不同，這個(gè)“深藍(lán)”可是一個(gè)大家伙，它的外表就像一個(gè)黑色的大柜子，重達(dá)1.4噸，有32個(gè)節(jié)點(diǎn)，每個(gè)節(jié)點(diǎn)有8塊專門為進(jìn)行國(guó)際象棋對(duì)弈設(shè)計(jì)的處理器，共計(jì)256塊這樣的處理器，集成在IBM的并行運(yùn)算系統(tǒng)中，從而擁有了每秒超過(guò)兩億步的計(jì)算速度。這是一個(gè)很簡(jiǎn)單粗暴的邏輯：既然我不會(huì)思考，也沒(méi)有什么直覺可言，那我就只要通過(guò)超人的計(jì)算速度，把棋盤上可能出現(xiàn)的每一種可能性都算一遍就可以了——這就是深藍(lán)算法的核心，暴力窮舉。嚴(yán)格來(lái)講，這還并不是人工智能，只是在硬件上的強(qiáng)大而已。

“深藍(lán)”的“大腦”——也就是芯片，主要由三部分組成：走棋模塊，評(píng)估模塊，以及搜索控制器。這三個(gè)部分，都是為了“優(yōu)化運(yùn)算速度”這一終極目標(biāo)而服務(wù)的。

其中需要說(shuō)一下的是占據(jù)了深藍(lán)“大腦”三分之二面積的評(píng)估模塊。它主要分三個(gè)部分。

首先是棋子位置評(píng)估。它采用的模式是在每一步后對(duì)盤面上所有棋子當(dāng)前所處的位置計(jì)分，不同棋子處于不同位置的分值都被事先計(jì)算好并寫入硬件，在實(shí)戰(zhàn)中，它會(huì)靈活的適用當(dāng)前局面下得分較高的走法。為了簡(jiǎn)化計(jì)算，IBM團(tuán)隊(duì)還根據(jù)大量的大師級(jí)棋譜，向“深藍(lán)”輸入了8000多種行棋模式，這就更加簡(jiǎn)化了計(jì)算的過(guò)程。

然后是殘局評(píng)估。IBM研制小組向“深藍(lán)”輸入了100年來(lái)所有國(guó)際特級(jí)大師開局和殘局的下法，這就使它能夠在一些時(shí)候直接參考?xì)v史上大師們的下法，從而減少計(jì)算量。

最后是慢速評(píng)估。它牽涉的主要是一些國(guó)際象棋的特殊指標(biāo)，比如局面的結(jié)構(gòu)，個(gè)人的棋風(fēng)這一類“看不見摸不著”的東西。當(dāng)然，這些所謂的“特殊指標(biāo)”終究也是反映在棋盤上的。深藍(lán)就可以憑這種評(píng)估方法，在全局上進(jìn)行自我調(diào)整。

事實(shí)上，卡斯帕羅夫在與“深藍(lán)”對(duì)奕時(shí)，就采用了一些“出奇制勝”的策略。他故意在開局中用出和尋常棋路大相徑庭的“怪招”來(lái)干擾“深藍(lán)”的棋路。然而，“深藍(lán)”迅速拋開了那些“套路”，用非人的計(jì)算速度碾壓了卡斯帕羅夫。

當(dāng)年這個(gè)事情出來(lái)以后，人們確實(shí)有些“機(jī)器比人強(qiáng)”的擔(dān)憂，不過(guò)心里不禁還有一線希望——因?yàn)槲覀冞€有圍棋。國(guó)際象棋只是一個(gè)8乘8的格子，每一步只有35種可能，每一盤棋80回合，就算加上各種變量，這個(gè)數(shù)量對(duì)于計(jì)算機(jī)來(lái)講也實(shí)在不算大。比如“深藍(lán)”可以算到每一步之后12步棋的信息，而人類最強(qiáng)的棋手也只能做到10步。這就和跟開了掛的選手比賽一樣，輸是很正常的。

那圍棋就復(fù)雜的多了，用“深藍(lán)”的方式肯定無(wú)法取勝。它每步有250種可能，一局棋可以長(zhǎng)達(dá)150回合。這就不是憑借“粗暴”的計(jì)算，蠻力的“強(qiáng)記”，以“固定”的程序邏輯決策，或窮極所有可能性進(jìn)行篩選就可以勝任的了。這導(dǎo)致人類一直相信，再?gòu)?qiáng)大的機(jī)器人也是沒(méi)有辦法對(duì)抗咱們的國(guó)粹。但是隨著阿爾法狗出現(xiàn)，它很快就讓我們無(wú)言了，然后留給我們一連串的興奮與憂傷。

說(shuō)到興奮，圍棋問(wèn)題與現(xiàn)實(shí)生活中的問(wèn)題是相通的，國(guó)人甚至將“博弈”圍棋視為洞悉人性、參悟人生的過(guò)程。然而，現(xiàn)在下圍棋的卻是一個(gè)機(jī)器，意味著這個(gè)機(jī)器除擁有超強(qiáng)的記憶能力、邏輯思維能力，還要擁有創(chuàng)造力甚至個(gè)性。

柯潔就曾這樣贊嘆過(guò)AlphaGo的“棋風(fēng)”：“感覺就像一個(gè)有血有肉的人在下棋一樣，該棄的地方也會(huì)棄，該退出的地方也會(huì)退出，非常均衡的一個(gè)棋風(fēng)，真是看不出出自程序之手?！?nbsp;AlphaGo有好幾次落子極其“非常規(guī)”，許多專業(yè)棋手都表示“看不懂”。而聶衛(wèi)平甚至表示自己想要對(duì)AlphaGo的“驚人一手”脫帽致敬，因?yàn)樗坝貌豢伤甲h的下法辟立了圍棋常識(shí)之外的新天地”。也就是說(shuō)，這不是AlphaGo從既往棋局中“復(fù)制”過(guò)來(lái)的，而是自己“創(chuàng)造”的戰(zhàn)術(shù)打法。

這個(gè)AlphaGo的最主要工作原理，就是近幾年人工智能領(lǐng)域最為熱門，也是我們?cè)谥敖?jīng)常提到的“深度學(xué)習(xí)”，通過(guò)模仿人類大腦神經(jīng)網(wǎng)絡(luò)，讓機(jī)器模擬人腦的機(jī)制進(jìn)行記憶、學(xué)習(xí)、分析、思維，還有創(chuàng)造……這一部分，我將在下一講當(dāng)中，為大家另作介紹。

今天，我主要帶大家回望了一下20年前的“人機(jī)大戰(zhàn)”。從“深藍(lán)”到“阿爾法狗”，人類科技的進(jìn)化史，似乎也是一個(gè)人們不斷立flag、又不斷被機(jī)器“吊打”的過(guò)程。不過(guò)這其中突破性的歷史意義，早已超越勝負(fù)。因?yàn)樵谖磥?lái)，人工智能肯定不單純會(huì)用來(lái)下棋，像我們前面所講，以及后面會(huì)繼續(xù)為大家講的那樣，它會(huì)掀起各個(gè)領(lǐng)域的產(chǎn)業(yè)變革、經(jīng)濟(jì)變革，甚至是社會(huì)變革。

知識(shí)清單

1. 事實(shí)上人類在棋類運(yùn)動(dòng)中被機(jī)器擊敗，AlphaGo并不是第一次。

2. AlphaGo最主要工作原理，就是近幾年人工智能領(lǐng)域最為熱門的“深度學(xué)習(xí)”

3.“深藍(lán)”的“大腦”——也就是芯片，主要由三部分組成：走棋模塊，評(píng)估模塊，以及搜索控制器。

今日思考

不過(guò)回到棋牌類這個(gè)小小的領(lǐng)域，大師們研究棋譜、與人實(shí)戰(zhàn)好幾千年，又從中參悟到了那么人生哲理和自然規(guī)律，可以說(shuō)是源遠(yuǎn)流長(zhǎng)了，沒(méi)成想?yún)s被機(jī)器人打敗。如果換做你的話，如果你所玩的游戲中的“最強(qiáng)玩家”被機(jī)器擊敗，這會(huì)影響從這個(gè)游戲中尋找快樂(lè)的動(dòng)力嗎？你對(duì)“人類最強(qiáng)大腦被機(jī)器人擊敗”這件事怎么看呢？

歡迎把你的見解在評(píng)論區(qū)與我們分享。我是屈直，我們下期再見。

知之×世界說(shuō)重磅推出知識(shí)付費(fèi)課程：輸?shù)舻奈磥?lái)
掃描下方二維碼，《輸?shù)舻奈磥?lái)》更多精彩內(nèi)容盡在“知之”微信公眾號(hào)

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：老工匠心隨天地 > 《科技》

舉報(bào)/認(rèn)領(lǐng)