文/張蕾應(yīng)虹霞車?yán)虬l(fā)自北京、廊坊、日本東京、大阪 2016年3月,《圍棋天地》第6期,首席編輯張大勇給農(nóng)心杯棋評(píng)起的標(biāo)題是《帝國斜陽》。 “人類圍棋創(chuàng)造了帝國,大家在這個(gè)帝國之中進(jìn)行爭(zhēng)霸。但是我覺得,這是我們最后一期純?nèi)祟悋澹▋?nèi)容),從下期開始有計(jì)算機(jī)的交融。起名叫《帝國斜陽》——這是純?nèi)祟悋宓狞S昏?!?/p> 在那期雜志后,英國DeepMind公司出品的圍棋軟件AlphaGo4:1擊敗了韓國的李世石九段,突破了人工智能(AI)在圍棋上的無法在互先的比賽中戰(zhàn)勝人類頂級(jí)高手的上限。 新一期的雜志被命名為《駭世晨曦》。 “當(dāng)時(shí)寫《帝國斜陽》的時(shí)候,還是認(rèn)為李世石肯定贏。” “可是你用’斜陽’,夕陽西下的這種感覺都有了。” “我當(dāng)時(shí)說’斜陽’,是指(一天中)最后的時(shí)光,正常的晝夜輪替,并不是要崩塌了,并不是說你不行?!?/p> 可這好像成了一道悲觀的寓言。 “輸完三盤棋以后,整個(gè)棋界微信圈都特別悲涼,覺得突然來了一個(gè)外星人,災(zāi)難來臨了一樣?!?/p> 迷戀與恐懼 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢(mèng)戰(zhàn)》一書,記述后者在第二屆夢(mèng)百合杯決賽中戰(zhàn)勝李世石的驚險(xiǎn)歷程和內(nèi)心成長(zhǎng)。當(dāng)時(shí)兩人擺棋時(shí),一家媒體來采訪,第一個(gè)問題就是,你希不希望人工智能圍棋出現(xiàn)?柯潔直接回:當(dāng)然不希望,因?yàn)槲艺幵邳S金時(shí)代。 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢(mèng)戰(zhàn)》 張大勇明白,李世石的脆敗,這使得棋手的神圣感淡化了很多,“棋界有沮喪的感覺”,曾經(jīng)篤定自己已經(jīng)爬上圍棋世界頂峰的、屈指可數(shù)的高手們被迫環(huán)顧四周,“發(fā)現(xiàn)很多高峰在旁邊立著”,“這個(gè)感覺,我覺得對(duì)于頂尖高手來講,對(duì)他內(nèi)心的摧殘非常難受。” 大事件面前,人們開始分化。有人頑固。一位圈內(nèi)人士本來身體不好,因?yàn)槔钍朗斊?,病情加重,“他是特別傷心,發(fā)自內(nèi)心地傷心。他病休了一段時(shí)間,他覺得人類圍棋竟然被一個(gè)計(jì)算機(jī)打成這樣,他在AlphaGo之后數(shù)個(gè)月,極力證明AlphaGo走的棋不行?!钡搅巳ツ甑捉衲瓿魽lphaGo化身Master網(wǎng)絡(luò)快棋對(duì)職業(yè)高手60連勝后,“他就變成了回避這個(gè)的事情。有點(diǎn)像剪辮子,有的人受不了,要藏起來,堅(jiān)決不剪,……他平日性格非常好,待人也非常友善,(但)有的時(shí)候你跟他談起來計(jì)算機(jī)強(qiáng),他就跟你翻臉。” 也有人困惑。理智的言辭是“不要盲目崇拜”。過激的話也有。有的棋手在時(shí)過半年后,還認(rèn)為AlphaGo和李世石的人機(jī)大戰(zhàn)是“做了一個(gè)局”。 有一部分棋手迅速臣服,擁抱AI。第一盤比賽后,張大勇問韓國棋手金志錫九段:機(jī)器棋力怎么樣?金直接擺了兩個(gè)子。在職業(yè)棋界,傳統(tǒng)規(guī)矩是每三個(gè)段位讓一子。讓兩子就意味著職業(yè)九段面對(duì)職業(yè)初級(jí)水平,“相當(dāng)于跑百米,他先讓跑20米似的”。 正在北京大學(xué)哲學(xué)系讀書的李喆六段發(fā)表了三篇與人機(jī)大戰(zhàn)有關(guān)的文章,其中第二盤戰(zhàn)罷后的《這兩盤棋沒有人會(huì)比李世石做得更好》,閱讀量的后臺(tái)數(shù)據(jù)是30多萬,達(dá)到歷史之最。 李世石在于AlphaGo的對(duì)決中以失利告終 看第二盤棋棋譜,李喆哭了。 “我確實(shí)從來沒有因?yàn)槠蹇捱^,基本上輸棋也沒有哭過,更沒有看到棋譜哭?!币徊郊鐩_,以及后面的一系列走法,當(dāng)時(shí)大家都認(rèn)為AlphaGo虧了,但最后它贏了,“贏得漂亮”。 “那步肩沖我認(rèn)為展現(xiàn)出來說明AI已經(jīng)有了所謂的’創(chuàng)造性’,不是機(jī)器本身的創(chuàng)造,而是它下出來的東西,幾乎是經(jīng)驗(yàn)之外的,雖然我們下過這步棋,但不是在這樣的情況之下,……他的這個(gè)肩沖,用俗一點(diǎn)的話就是超越時(shí)代的,我們這個(gè)時(shí)代可能下不出來這個(gè)棋?!?/p> 他形容當(dāng)時(shí)的感受:“很震撼”,“就好像一個(gè)畫家看到一個(gè)一百年后的藝術(shù)品。” “你說他超越了時(shí)代,但他在這個(gè)時(shí)代出現(xiàn)了,那他豈不是創(chuàng)造了一個(gè)時(shí)代?” “對(duì),是這樣的。圍棋現(xiàn)在已經(jīng)進(jìn)入了智能圍棋的時(shí)代。” 李喆在日后的一篇文章中說,“人工智能,在迄今為止的工具進(jìn)化史中,它的出現(xiàn)很晚。越晚出現(xiàn)的工具,力量通常會(huì)越強(qiáng),人們對(duì)它的迷戀和恐懼也會(huì)越大?!?/p> 怪獸長(zhǎng)成記 2017年3月18日,日本東京電氣通信大學(xué)。 加藤英樹是UEC杯比賽會(huì)場(chǎng)上最忙碌的人。他是年紀(jì)最大的“參賽者”,要會(huì)友、社交、教徒、受訪,還義務(wù)承擔(dān)一些順便的會(huì)務(wù)工作。 樸廷桓和DeepZenGo的研發(fā)者加藤英樹 UEC杯是日本電氣通信大學(xué)主辦的機(jī)器圍棋比賽,到2017年已經(jīng)10屆。在AlphaGo降臨之前,這里是圍棋AI最前沿的陣地。加藤英樹是日本最強(qiáng)AI圍棋DeepZenGo的代表,按照他的劃分,1984到2005年,AI圍棋走過漫長(zhǎng)的古典時(shí)代,人類將自己對(duì)圍棋的理解,平移到AI圍棋中,由于變化太多,邏輯復(fù)雜,這樣的平移成果很差。隨著2006年蒙特卡洛樹搜索的出現(xiàn),Zen誕生,UEC杯開辦,見證了AI圍棋急劇發(fā)展的時(shí)期。2016年DeepMind發(fā)表論文,AI圍棋進(jìn)入AlphaGo時(shí)代。AlphaGo的原理中既包含蒙特卡洛樹搜索,又增加了政策網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)兩個(gè)通過自我學(xué)習(xí)而構(gòu)建起的神經(jīng)網(wǎng)絡(luò),使得機(jī)器棋力突破職業(yè)水平的瓶頸,并以幾何倍的速度日益進(jìn)化。去年Zen受AlphaGo影響升級(jí)為DeepZenGo,實(shí)力亦大為增長(zhǎng)。 末代UEC杯開賽。從明年起,比賽將更換主辦方。 比賽的場(chǎng)面很松弛,程序員們穿著休閑裝,正式開賽以后便把時(shí)間都交給機(jī)器,主人們?nèi)齻z倆聚在一起聊天。 “這個(gè)圈子本來是很和氣的一個(gè)圈子,不過今年變成兩大怪獸對(duì)決。”來自臺(tái)灣的旅日棋手王銘琬九段在與其他人交談時(shí)說道,“那種感覺就是一個(gè)小村子的角力比賽,兩大怪獸突然跑進(jìn)來參賽?!蓖隀C(jī)器賽畢會(huì)接受職業(yè)棋士指導(dǎo)一盤,而今年的冠亞軍決出后幾乎是以指導(dǎo)的姿態(tài)去跟職業(yè)棋手下。” “(過去跟現(xiàn)在)完全是兩回事?!?/p> 大概在六七年前,王銘琬擔(dān)任UEC杯裁判長(zhǎng),那時(shí)候他最大的任務(wù),是在機(jī)器中途停掉“不知道要怎么辦”時(shí),去評(píng)判誰贏誰輸——就像踢足球踢不到90分鐘就沒體力踢下去了。 對(duì)于半途而廢局面勝負(fù)評(píng)判的爭(zhēng)議,大家通常不太在乎。 “參加這個(gè)棋賽的選手,大家都是同志,不是敵人。大家都為了提升電腦圍棋,往一個(gè)目標(biāo)去努力?!蓖蹉戠f。 加藤在現(xiàn)場(chǎng)指導(dǎo)初來參賽的大學(xué)生程序員也體現(xiàn)出這樣的意味。今天強(qiáng)大的“怪獸”也是笨拙的過往積累出來的,即便在去年,Zen還需要被讓三個(gè)子。今年實(shí)現(xiàn)互先,并互有勝負(fù)。 雷米-庫倫和黃士杰 將蒙特卡洛樹搜索用于圍棋程序的先驅(qū)、法國人雷米-庫倫(RémiCoulom)今年的成績(jī)不佳,只得到第五。 雷米是AjaHuang的老師,AjaHuang是AlphaGo論文并列第一作者,AlphaGo的人肉臂黃士杰博士。 雷米稱對(duì)自己的成績(jī)?cè)缬蓄A(yù)料,因?yàn)闆]有用GPU(圖形處理器GraphicsProcessingUnit的縮寫)。 “我的大部分業(yè)務(wù)還是售賣手機(jī)應(yīng)用,手機(jī)上可沒有GPU,所以我還是要將精力集中在不使用GPU的情況下,如何讓軟件變得更強(qiáng)?!?2歲的法國人說,“也許是因?yàn)槲易兝狭?,我發(fā)現(xiàn)我對(duì)于激烈的競(jìng)爭(zhēng)沒有那么大的動(dòng)力。我們會(huì)繼續(xù)精進(jìn)瘋石,但我這么做是出于樂趣?!?/p> 剛聽說AlphaGo的消息時(shí),他為Aja感到高興,但同時(shí)也有一點(diǎn)難過,“因?yàn)檫@是一種終結(jié)……十年來,打敗職業(yè)棋手一直是一個(gè)令人興奮的目標(biāo)?,F(xiàn)在這一切都終結(jié)了。但是,沒關(guān)系,我可以把注意力轉(zhuǎn)移到其他項(xiàng)目上?!?/p> 可能是語言的緣故,也可能出于靦腆,談話間他會(huì)有很多躊躇。尤其是在被問到與Aja如今的聯(lián)系時(shí),雷米說,“是的,我們有聯(lián)系,但是你知道,他們公司對(duì)員工對(duì)外交流控制得很嚴(yán)……有時(shí)候我會(huì)問他問題,他會(huì)說,’啊……可能……也許……’他啥也不能說?!?/p> 這是獨(dú)立開發(fā)者和大公司員工之間的距離。 “新技術(shù)需要強(qiáng)大的計(jì)算力,所以我想大公司能夠動(dòng)用龐大的計(jì)算力,而我沒有這樣的途徑。所以……作為一個(gè)個(gè)人研究者,現(xiàn)在已無力與大公司抗衡,但是,不管怎樣,在計(jì)算機(jī)游戲的歷史上,有的時(shí)候有好的想法比擁有強(qiáng)大的硬件要更重要。能夠冒出好的想法依然還是讓人心潮澎湃?!?/p> 曾經(jīng)在AI圍棋界處于頭號(hào)地位的Zen,是由尾島陽兒和加藤英樹兩人自主開發(fā)。加藤10年前因過勞而患抑郁癥,辭職后靠政府的殘障年金過日子。遵醫(yī)囑的話,他每天只能工作3到4小時(shí)。但從UEC杯到接下來大阪舉辦的最強(qiáng)棋士戰(zhàn)(中日韓棋手羋昱廷、井山裕太、樸廷桓迎戰(zhàn)DeepZenGo),63歲的老人家要連軸轉(zhuǎn)。如今DeepZen的研發(fā)經(jīng)費(fèi)還是出自尾島和加藤個(gè)人,加藤的經(jīng)濟(jì)收入主要來自講演和熱心人士捐助,加上早年研究所時(shí)代的積蓄。去年因AlphaGo帶熱人工智能而加入Zen團(tuán)隊(duì)工作的DOWANGO,主要負(fù)責(zé)向兩位研發(fā)者提供服務(wù)器。 抑郁癥給加藤造成身體的損害是不可逆的,“腦子中有部分組織半永久不可復(fù)元了,血清素不足,神經(jīng)傳導(dǎo)受限,所以容易誘發(fā)睡眠障礙,一過勞就會(huì)暈倒?!奔犹匍_玩笑說,人工智能火了之后,自己也成了人氣明星,因?yàn)閆en,他的工作紛至沓來,簡(jiǎn)直“像藝人一樣”,嗔怪Zen“真是一個(gè)耍得父母團(tuán)團(tuán)轉(zhuǎn)的孩子?。 ?/p> 從入行以來,加藤的動(dòng)力始終沒變,“人工智能研發(fā)至今都還沒有大腦——我想給它植入一個(gè)!給圍棋軟件,植入一個(gè)真正意義上的聰明的大腦,這是我最初開始研發(fā)圍棋人工智能的理由之一。標(biāo)準(zhǔn)19路的圍棋很難,很難擊敗專業(yè)棋手,但AlphaGo在我沒有想像到的,在ZEN的短板處增強(qiáng)了研發(fā),擊敗了職業(yè)棋手,老實(shí)說,我很困惑。” “在我們IT或者計(jì)算機(jī)科學(xué)領(lǐng)域里面,毫無例外,重要的工作都是由公司來做。”人工智能專家、北京郵電大學(xué)教授劉知青說。他同時(shí)是北郵九鼎計(jì)算機(jī)圍棋研究所所長(zhǎng)。 在程序世界里,存在著成千上萬種編程語言,真正走進(jìn)大眾生活的,都是大公司出品,比如C++是貝爾實(shí)驗(yàn)室的,JAVA是甲骨文的,Windows是微軟的……大學(xué)里的研究組也做,但影響都不及人們耳熟能詳?shù)倪@些產(chǎn)品,“因?yàn)檫@些東西除了科學(xué)上的進(jìn)步之外,……它要數(shù)據(jù)的準(zhǔn)備,它要計(jì)算資源,……大量的機(jī)器、人員、資金,方方面面的投入。” 說到底,計(jì)算機(jī)科學(xué)不像數(shù)學(xué)領(lǐng)域,“證明”即達(dá)成。計(jì)算機(jī)科學(xué)始終要面對(duì)工程和效率的問題。在怪物養(yǎng)成記背后,是程序員個(gè)人選擇的合集。 劉知青在紐約大學(xué)念書時(shí),親眼目睹了兩種選擇下的人生道路。有的全職終身教授放棄了教職,去了貝爾實(shí)驗(yàn)室,“他們?cè)敢庠诖蟮膱F(tuán)隊(duì)里面,做出一個(gè)更有影響的事情?!币灿械娜藞?jiān)持留在大學(xué)里,做一般公司不太做的初期創(chuàng)新,這里包含了研究的自由。 “最早的蒙特卡洛的方法,神經(jīng)網(wǎng)絡(luò)的方法,都是大學(xué)的研究團(tuán)隊(duì)來做的,并不是公司來做。只是當(dāng)這些東西相對(duì)成熟了,那么大公司就把它拿來,做成一個(gè)有影響力的產(chǎn)品?!眲⒅嗾f。 隨著UEC杯的落幕,我與雷米談起他對(duì)這個(gè)比賽最美好的記憶。他說:“我得過4次冠軍。每次獲勝都是很美好的記憶。事實(shí)上,我人生第一次來日本也是因?yàn)閁EC杯主辦者的邀請(qǐng),多虧了UEC杯,我才能來日本,現(xiàn)在也和日本人做生意。我印象深刻的是,我第一次來日本。此前我從未到過亞洲。我生在法國。那是2007年(我來到日本),就好像發(fā)現(xiàn)了一個(gè)嶄新的星球一樣?!?/p> 數(shù)與道的轉(zhuǎn)化 2015年,樊麾結(jié)束歐洲圍棋大會(huì)后回到在法國的家。他收到一封郵件,英文的。他英文不好,一般這樣的郵件會(huì)遭到無視。但誰知道為什么,他讀了這封來自英國的郵件。 郵件說,我們是一家倫敦的公司,想邀請(qǐng)你來看一看。樊麾跟他們開了線上會(huì)議,上網(wǎng)搜了公司主頁,看到了上面有圍棋,說服自己相信收到了一個(gè)真實(shí)的邀請(qǐng)。 英國人告訴這位早年在中國成為職業(yè)二段后遠(yuǎn)渡重洋在法國為圍棋開枝散葉的棋手、教練,希望他輔助他們研究機(jī)器圍棋。樊麾一度設(shè)想自己會(huì)渾身插滿設(shè)備,用以導(dǎo)出下棋時(shí)的思考方式。 而最終他要做的非常簡(jiǎn)單:跟程序下棋。他很輕松地說,要一個(gè)小時(shí)就夠了。 2015年10月,正在與AlphaGo苦戰(zhàn)當(dāng)中的樊麾(右一)。 他第一次跟機(jī)器下棋在2005年的法國。一開始機(jī)器運(yùn)轉(zhuǎn)的聲音很平緩,對(duì)弈時(shí),機(jī)器的響聲變得劇烈起來,聽上去仿佛真的有腦漿在翻滾在思考。到了2015年,他以為,類似的經(jīng)驗(yàn),平移到英國,就可以。 在他的概念里,人類棋手強(qiáng)于全局觀,能用組織化的思維看待各個(gè)要素,所以在與AlphaGo的第一局比賽時(shí),“我下得很有全局觀,下得很慢,不急于進(jìn)攻?!睂?duì)局中,他漸漸發(fā)現(xiàn),AlphaGo要的,跟他一樣。 比賽的結(jié)果全世界都知道了,5:0,AlphaGo完勝。 跟AlphaGo對(duì)弈之后,“我內(nèi)心的圍棋世界坍塌了”。其后樊麾參加一項(xiàng)重要的歐洲比賽,每局45分鐘的時(shí)限,加上被AlphaGo沉重打擊的內(nèi)心,他幾乎沒有信心參賽。 “但非常奇怪的事情發(fā)生了——我贏了所有的比賽,非常輕易的。我努力想要弄清楚到底發(fā)生了什么。我看到我和AlphaGo的比賽,找到了一個(gè)新的視角來看我自己的比賽?!?/p> 樊麾在波士頓大學(xué)演講時(shí)道出了自己的故事。 “當(dāng)你學(xué)圍棋的時(shí)候,你學(xué)的第一件事是定式、布局,好的方向,好的形狀。第二步就是怎么樣最好地利用這些形狀。但這些還遠(yuǎn)遠(yuǎn)不夠。如果你想打敗大師,你必須忘記你之前學(xué)的所有的東西。因?yàn)槟銓W(xué)的所有東西都像一個(gè)籠子一樣,把你關(guān)在里面……你想的是定式是什么,布局是什么,有時(shí)你忘了如何才能讓這些棋子聯(lián)合生效,這就是為什么,當(dāng)我和AlphaGo比完賽之后,我覺得世界坍塌了,但同時(shí)建立起了新的東西,現(xiàn)在我下起棋來完全自由了?!?/p> 這個(gè)自由的故事為他贏得了掌聲。他在AlphaGo的V18版本中經(jīng)歷和思考的,世界頂級(jí)棋手們?cè)赩25及此后的版本中,逐漸體味。 “最開始看到當(dāng)然覺得不能理解,覺得不知道好在哪。但是他就在你不知道他哪里好的時(shí)候他就贏了。所以再多看了一些之后,雖然你不理解他好在哪,但他就是這么下就可以贏。所以你就想辦法慢慢去理解唄。越來越感受到他的強(qiáng)?!敝茴Q蚓哦握f,“一開始感覺很難接受這個(gè)東西,但是越來越覺得自己理解得太淺太淺了,對(duì)圍棋的理解。越來越覺得自己還是太弱?!?/p> 國際象棋領(lǐng)域很早就引入計(jì)算機(jī)輔助棋手訓(xùn)練,計(jì)算機(jī)的棋力早已做到可以讓職業(yè)高手一馬。從項(xiàng)目本身的復(fù)雜程度來說,國際象棋要稍遜于圍棋,因此對(duì)于定式和原則的限定會(huì)更明確,在這樣的背景下,被計(jì)算機(jī)攻破職業(yè)堡壘后,人與機(jī)器達(dá)到接受與融合,部分定式廢止,公認(rèn)的和棋被推翻,人類的棋力也得到大幅提高。 某種程度上,國際象棋已經(jīng)成為圍棋的前車之鑒。 顛覆會(huì)帶來震蕩,認(rèn)知上的震蕩,表面不彰,內(nèi)心翻滾澎湃。 “這個(gè)我倒不覺得是打擊,我倒覺得是挺興奮的一個(gè)事情,這太有趣了。如果沒有它的話,我們可能一百年之后,一上來還不敢用點(diǎn)三三。其實(shí)它點(diǎn)三三之后我們都明白它為什么點(diǎn)三三,它不扳粘,它是有它的很明顯的道理的,但是由于我們的慣性思維,點(diǎn)三三之后一定會(huì)扳粘的,習(xí)慣了,那樣的話我們就不會(huì)去點(diǎn)三三。”李喆六段說。開局不久點(diǎn)三三已經(jīng)成為多位職業(yè)棋手在大賽中嘗試運(yùn)用的新招法。 三-三是指從棋盤邊線開始數(shù),向里橫向第三行,縱向第三列的交叉點(diǎn)。人機(jī)大戰(zhàn)首局,柯潔執(zhí)黑在第3手和第7手連續(xù)搶占兩個(gè)三-三。 “我覺得很有意思的是,我之前有一個(gè)同學(xué)拍了一個(gè)畢業(yè)作品,是講的吳清源和秀哉的那盤棋,里面引用了一句話,三三的弱點(diǎn)是星位,星位的弱點(diǎn)是三三,現(xiàn)在Master或者是AlphaGo很好地去證明了這一點(diǎn)。因?yàn)橐郧爸v星位的弱點(diǎn)是三三,更多的意思是抽象的,腳步很空虛,不踏實(shí)的。但是現(xiàn)在三三可以直接肩沖,星位可以直接點(diǎn)三三,但是并不能證明星位和三三就不好了。這其實(shí)是一個(gè)很辯證的東西,很有意思。我覺得圍棋里充滿了這樣的東西?!?/p> “研究機(jī)器的招法的樂趣在于什么?” “研究機(jī)器的招法的樂趣在于把它轉(zhuǎn)化成我能理解的思維方式?!?/p> 李喆在此前做了七路圍棋研究,整個(gè)棋盤全部算清,一比較就知道下哪個(gè)點(diǎn)。到十九路圍棋,人已經(jīng)算不清了,“我們就說這個(gè)地方是厚還是薄,這個(gè)地方是虛還是實(shí),我用什么樣的策略?!?/p> “人工智能體現(xiàn)出來的其實(shí)更趨近于第一種思路,雖然它也達(dá)不到窮盡,但它還是基于數(shù)的一種,最后是勝率的比較?!笨傊霸谀軌蛴脭?shù)學(xué)達(dá)到的地方,就用數(shù)學(xué)去達(dá)到它,我們?cè)跀?shù)學(xué)達(dá)不到的地方,我們用道的方式來理解,道理的方式更模糊,但是更具有普遍性,認(rèn)識(shí)圍棋也是這樣?!比斯ぶ悄鼙旧聿皇窃趧?chuàng)造,它只是一個(gè)算法,但作為接收方,我們以人的方式理解,這就構(gòu)成了“數(shù)和道的對(duì)話”,“用我們的道理的方式理解它的創(chuàng)造性,就會(huì)變成我們自己的吸收,我覺得這個(gè)是非常非常有意義的事情?!?/p> “人是沒有出路的” 2016年11月。 60歲的日本棋手趙治勛九段對(duì)DeepZenGo的電王戰(zhàn)中,DeepZen顯示勝率超過50%的情況下,加藤代表主動(dòng)認(rèn)負(fù),引起爭(zhēng)議。 “一般來說是將勝率預(yù)測(cè)設(shè)定在某一特定數(shù)值,比方說30%(低于30%則機(jī)器認(rèn)負(fù))。但如果在勝率預(yù)測(cè)40%的時(shí)候,我感覺盤面比較艱難,也會(huì)武斷地決定投子認(rèn)輸。這種靈活的判斷,還是只有人類能做,機(jī)器不靈......所以基本上是由我來作出判斷的。……總之,認(rèn)輸這件事,目前還是需要研發(fā)團(tuán)隊(duì)來作出判斷,而不是交給AI圍棋本身。我聽說AlphaGo的這個(gè)數(shù)值是10%,我不太喜歡這個(gè),這里還是有文化差異的吧,日本和歐美對(duì)圍棋文化的理解不同。在日本,有’玷污棋譜’一說,如果最后的棋型走得很奇怪的話,對(duì)圍棋是一種褻瀆。日本有這樣的傳統(tǒng)?!?/p> 對(duì)此,劉知青則表示反對(duì),“我覺得把它中斷下來是不合適的,因?yàn)槲易鳛橐粋€(gè)科研人員來看它,這是一個(gè)測(cè)試過程,我希望能夠展現(xiàn)它的弱點(diǎn)是什么。加藤把它停下來了,其實(shí)是阻礙它的弱點(diǎn)的暴露。” 另有觀點(diǎn)認(rèn)為,加藤替機(jī)器做決定,可能使機(jī)器喪失原本運(yùn)籌的取勝機(jī)會(huì)。加藤也承認(rèn),自己電王戰(zhàn)時(shí)意識(shí)還停留在機(jī)器水平大幅落后于人類棋手時(shí)期,認(rèn)為死磨硬泡等待對(duì)手犯錯(cuò)與玷污棋譜無異,“現(xiàn)在回過頭來,我覺得那個(gè)時(shí)候,就有必要修改認(rèn)輸機(jī)制了——因?yàn)榈搅嘶ハ龋闶强梢缘却龑?duì)方出錯(cuò)的,這沒有關(guān)系。然而我當(dāng)時(shí)并沒意識(shí)到。……(不過)有這種(原本勝機(jī)喪失掉)可能也沒有什么。本來就是研發(fā)者在承擔(dān)所有的責(zé)任。比方說,如果在對(duì)弈過程中,程序出現(xiàn)BUG,然后AI圍棋輸了,這些責(zé)任都是研發(fā)者在承擔(dān)。最后的認(rèn)輸判斷也不例外。說到底,一切交由AI,也是研發(fā)者作出的判斷?!?/p> 劉知青反對(duì):“你沒有決定權(quán),當(dāng)它下棋的時(shí)候,你已經(jīng)沒有決定權(quán)了”“你替他認(rèn)輸,真是有悖于科學(xué)的道理,……你要看AlphaGo被李世石擊敗的時(shí)候,它是怎么下荒唐棋的,這個(gè)是我們?yōu)閿?shù)不多的一個(gè)機(jī)會(huì)見到這件事,你不讓它(繼續(xù)下),怎么辦?” 科學(xué)精神、人類的自主權(quán),人對(duì)工具的態(tài)度,與工具的關(guān)系,與自我和認(rèn)知緊密相聯(lián)。 有人工智能專家曾經(jīng)預(yù)言,如果制造出能戰(zhàn)勝職業(yè)棋手的國際象棋AI,那么后者一定具備從戰(zhàn)略素養(yǎng)到戰(zhàn)術(shù)能力的全方位的強(qiáng)人工智能。事情并未這樣發(fā)展,但結(jié)果是人類收獲了足以輔佐其棋藝精進(jìn)的機(jī)器。 跟國際象棋AI類似,圍棋AI并非從人類總結(jié)出的棋理邏輯出發(fā)來構(gòu)建,而是將人下棋的過程,拆解出大量的對(duì)弈積累(政策網(wǎng)絡(luò)),識(shí)別形狀的好壞(價(jià)值網(wǎng)絡(luò)),對(duì)變化的可能性進(jìn)行有效篩選剪枝后隨機(jī)搜索驗(yàn)證(蒙特卡洛樹搜索),得出人看來最優(yōu)化的一步(勝率最高)落子。 “AlphaGo(圍棋行為的輸入和輸出)的過程,它也可以更好地揭示了人下圍棋的過程。”劉知青說,這反過來讓我們“對(duì)于人類思考的一種方式,可能有個(gè)更深的、更本質(zhì)的理解,我覺得這個(gè)意義上可能更重大一點(diǎn)。……曾經(jīng)認(rèn)為圍棋就是一個(gè)神圣的東西,其實(shí)它不是,或者說認(rèn)為我們大腦思維是一種神圣的東西,其實(shí)也不是,它是一個(gè)神經(jīng)系統(tǒng)的物理過程,但可能超出了普通的認(rèn)識(shí),但是也不是一個(gè)不可超越的或者是神秘的過程,現(xiàn)在我們可以看到,所有的這些物理過程都不是神秘的,我們有更好的認(rèn)識(shí),而且是可以復(fù)制他們的,而且可以超越他們的。” 這樣的認(rèn)知、復(fù)制和超越的過程,使得人工智能由弱變強(qiáng),終極問題隨之誕生:最終人工智能會(huì)導(dǎo)向何種歸宿呢? 樂觀的觀點(diǎn)是工具強(qiáng)大且受人控制,為人服務(wù)。悲觀的如特斯拉的老板ElonMusk,他認(rèn)為最好的情況是,人成為機(jī)器的寵物?;艚鹨矊?duì)人類未來的掌控權(quán)擔(dān)憂。 “我覺得首先這個(gè)東西好壞不講,這個(gè)趨勢(shì)是必然的,就是說這個(gè)是必然的方向,無論好壞?!眲⒅嗾J(rèn)為,縱然前途未知,人類卻仍然會(huì)將人工智能發(fā)展下去,并承擔(dān)好與壞可能性的并存。 “人必須要做。因?yàn)槿艘?jìng)爭(zhēng)。你競(jìng)爭(zhēng)就得利用這個(gè)東西,除非你不競(jìng)爭(zhēng)了,你說我放棄,沒有人愿意放棄,你要競(jìng)爭(zhēng),你必須要做這個(gè)事情,除非你說跟我無關(guān),我這人放棄了,但是只要你想競(jìng)爭(zhēng),你必須要利用機(jī)器,你利用這個(gè)機(jī)器的時(shí)候,你就要促進(jìn)它的發(fā)展,這個(gè)機(jī)器肯定會(huì)越來越強(qiáng),這個(gè)與你一直無關(guān)嗎?” “其實(shí)是人性促使了這個(gè)東西?” “是的。人是沒有出路的?!嗽诮柚@樣的工具,你沒有辦法(避免爭(zhēng)奪掌控權(quán))?!?/p> 人類親手為自己開創(chuàng)了一個(gè)未知的結(jié)局。在劉知清看來,意義更多地落于奔向這個(gè)結(jié)局的過程:“我們是通過人工智能的研究,通過機(jī)器的發(fā)展,也是認(rèn)識(shí)人的局限性、人的能量、人的地位,其實(shí)都是認(rèn)識(shí)我們自己,認(rèn)識(shí)到我們自己。” 自由的人 從小下棋,國家隊(duì)10年,有個(gè)問題一直困惑著李喆——下棋的社會(huì)意義是什么?父母親是醫(yī)生、教師,他們的社會(huì)意義很好理解。棋手成天下棋,為了什么?追尋棋道嗎?那么,棋道又是什么?是勝負(fù)嗎?當(dāng)一位棋手年紀(jì)漸長(zhǎng),反應(yīng)速度變慢,計(jì)算力下降,無法在現(xiàn)有的競(jìng)技體系中獲取勝利了,那他(她)追求的就不是棋道了嗎? 李喆跟時(shí)越、樸文垚等棋手朋友探討過這個(gè)問題,沒誰說得清。他去看書找答案,獲得一些啟發(fā),但難以系統(tǒng)。所以,當(dāng)讀大學(xué)的機(jī)會(huì)降臨時(shí),他毫不猶豫地選擇暫別競(jìng)技體系,那時(shí)他的等級(jí)分排在全國前三,距離世界冠軍并不遠(yuǎn)。 AlphaGo的降臨成為棋手參悟圍棋、理解自身與社會(huì)關(guān)系的重大機(jī)會(huì)。 “我們對(duì)于圍棋的認(rèn)識(shí)有了更趨近真理的方法,之前從來不知道我們對(duì)圍棋的認(rèn)識(shí)到底達(dá)到一個(gè)什么程度,有了這個(gè)之后,可能有了更好的參照,有更好的幫助我們?nèi)ダ斫?。”李喆說。 AlphaGo是用強(qiáng)大到深不可測(cè)的棋力來給人們提供參照的。 “AlphaGo的棋風(fēng)可能是千變?nèi)f化的,沒有什么是它的棋風(fēng)。它沒有棋風(fēng),隨心(所欲)?!敝茴Q蛘f,“看到它樸實(shí)地下,就可以贏,就是美啊?!?/p> “對(duì)你來說,它是一個(gè)棋手嗎?” “當(dāng)然……是。對(duì)于我們現(xiàn)在來說,它就是神?!?/p> 羅洗河九段受邀參與人工智能圍棋的研制和測(cè)試時(shí),旁人為了增加產(chǎn)品與工作人員的親近感,說,我們把產(chǎn)品當(dāng)孩子一樣養(yǎng)大吧。羅洗河說,我不這么認(rèn)為,“我就是在造神”。一年多的工作下來,羅說,“造神是無法求證的理想。不斷的更近一些也是很美妙的?!?/p> 跟很多棋手的感知相反,圍棋AI給王銘琬的啟示是,“不用那么懷疑自己”,“其實(shí)我個(gè)人下棋一開始還是蠻有用概率性的想法去下?!?/p> 這位本因坊戰(zhàn)、王座戰(zhàn)、日本大師賽冠軍,圈中人稱“怪腕”的棋手說,“因?yàn)槲冶旧聿⒉皇悄欠N一流的棋手,運(yùn)氣好的時(shí)候拿一兩個(gè)頭銜。我跟柯潔、趙治勛一開始就站在不一樣的地方在看這個(gè)圍棋??聺嵤且韵纶A為目的,而我只覺得,下完了……只要好玩就好了。……圍棋電腦到現(xiàn)在并沒有告訴人到現(xiàn)在人對(duì)圍棋的看法和研究是沒有用的,正好是相反,這個(gè)方向是沒錯(cuò)的……以前自己對(duì)這個(gè)方向的努力還不夠。” 在王銘琬看來,“圍棋的目的不是為了打敗對(duì)方,而是雙方共同創(chuàng)出的一個(gè)時(shí)間跟作品。從這個(gè)方面來說,電腦打敗人類,是讓人類回歸原點(diǎn)?!眲儇?fù)只是一個(gè)人為的機(jī)制,“說人類很注重勝負(fù)只是因?yàn)樗菀讏?bào)道,容易理解,并不是說人類真的只喜歡勝負(fù),要是脫離了勝負(fù)這個(gè)桎梏、枷鎖的話,說不定會(huì)有更自由的發(fā)揮,是(我)自己抱有的看法?!?/p> 圍棋傳媒有個(gè)經(jīng)典問題:如果有“圍棋上帝”,你認(rèn)為自己跟祂有多大差距? 在AlphaGo出現(xiàn)之后,棋手們對(duì)這個(gè)問題的答案有了更謙遜,同時(shí)又包含更多可能性的回答和思考。 正在與DeepzenGo對(duì)弈的趙治勛(右) “人很難去評(píng)判有沒有上帝這回事。但上帝,確實(shí)是遲遲不肯露臉的那個(gè)存在,不肯跟我們?nèi)祟惼迨忠黄鹎写瑁磺泻染屏奶?。但AI出來了,至少在形式上是看得見摸得著的。它比人類更強(qiáng)大,比李世石、柯潔更強(qiáng)大,成了一種類似上帝般的存在,然后我們?nèi)祟悶榱私咏?,努力去追趕去超越。這跟從前不一樣的。從前的話,一旦成了人類中的最強(qiáng)棋手,就會(huì)以為老子天下第一,不得了了。但現(xiàn)在,AI來襲!它或許就是上帝的化身,是看得見摸得著的上帝。而因?yàn)榭吹靡?,它吸引著我們?nèi)祟惼迨秩タ拷那翱床灰?,所以人類就在那里坐等著。在未來的圍棋世界,就算你達(dá)到人類棋手之最了,你未必是圍棋世界之最,就會(huì)激發(fā)起你的上進(jìn)心。而不像從前,自以為老子天下第一,你會(huì)變得謙卑,用心精進(jìn)。這,我覺得實(shí)在太有趣了!”韓國旅日的超一流棋手、日本棋戰(zhàn)獲頭銜次數(shù)最多的棋手趙治勛九段說。 作為一個(gè)傳奇人物,他在當(dāng)下最傳奇的事情莫過于,沒有手機(jī)。 “在日本,沒有手機(jī)的恐怕也只有我一個(gè)了(笑)。因?yàn)槲也粫?huì)弄手機(jī),對(duì)我純屬浪費(fèi)?!?/p> 這個(gè)沒有通訊工具的人,我們只有在棋賽上才得一見。在3月日本大阪舉行的最強(qiáng)棋士戰(zhàn)中,趙治勛出任裁判長(zhǎng)。循慣例,日本大賽會(huì)舉行前夜祭。標(biāo)志性的蓬亂的頭發(fā),紅潤的面色,趙治勛在舞臺(tái)中央妙語連珠,活像得到了落語大師的真?zhèn)?。前夜祭上每個(gè)人都著正裝出席,加藤英樹先生也脫下圍棋AI大賽上的休閑打扮,換上筆挺光鮮的西裝。 在性質(zhì)不同的比賽中快速切換,讓人難免有恍惚之感。世界似乎越來越大,在思維層面上,我們擁有不斷被解放出來的自由。 “如果可以選擇,您更愿意做很老實(shí)但很少犯錯(cuò)無懈可擊不知疲倦的AI圍棋棋手,還是很狡猾但會(huì)犯錯(cuò)的人類棋手?”這個(gè)問題只提給過老頑童趙治勛。 “我寧愿當(dāng)個(gè)人,下棋有輸?shù)臅r(shí)候,也有贏的時(shí)候。輸棋的時(shí)候我總會(huì)非常非常悲傷,簡(jiǎn)直就是世界末日。但正因?yàn)檫@樣,所以贏棋時(shí)的快樂,就是百倍的。而如果是一直贏下去,永遠(yuǎn)不會(huì)輸?shù)脑?,恐怕太無趣了。所以我想當(dāng)人?!壁w治勛說。 他還擁有著為人的任性。在嚴(yán)肅闡述了AlphaGo的強(qiáng)大之后,他說,“如果代表人類出戰(zhàn)的是柯潔,我相信他將百分百戰(zhàn)勝AI圍棋。”理由也是百分百人的理由,“我堅(jiān)信柯潔能贏。因?yàn)槲腋P(guān)系很好。這不是玩笑話??聺嵅?9歲。我從前也有過一陣棋力還算強(qiáng)的時(shí)候。按道理說,柯潔不可能知道我,可是在某些聚會(huì)中見面,他都會(huì)主動(dòng)跟我打招呼,向我問好,我非常非常開心!真的。我一直以為他不可能知道我這個(gè)人的......我是柯潔的粉絲!” 而在昨天的第一局較量后,執(zhí)黑以1/4子惜敗的柯潔表示:“(自己)輸?shù)脹]什么脾氣?!?。 (楊昕雨對(duì)本文亦有貢獻(xiàn)。感謝常昊、周睿羊、李喆、劉知青、華學(xué)明、張大勇、謝銳、王煜輝、房學(xué)峰、王平、加藤英樹、羋昱廷、趙治勛、王銘琬、俞斌、馬林、羅洗河、雷米-庫倫受訪) |
|