乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      柯潔應(yīng)決勝前半盤 戰(zhàn)AlphaGo要有自信 | 陳經(jīng)

       徒步者的收藏 2017-05-23

      柯潔應(yīng)決勝前半盤 戰(zhàn)AlphaGo要有自信 | 陳經(jīng)

      2017-05-22 陳經(jīng) 風(fēng)云之聲
      風(fēng)云之聲

      fyvoice

      科技與戰(zhàn)略風(fēng)云學(xué)會(huì),科學(xué)素養(yǎng),家國(guó)情懷,橫跨文理,縱覽風(fēng)云?!吨芤住の难浴罚骸熬盼逶唬猴w龍?jiān)谔欤?jiàn)大人,何謂也?子曰,同聲相應(yīng),同氣相求。水流濕,火就燥。云從龍,風(fēng)從虎。圣人作而萬(wàn)物覩?!?/span>


      提升思維層次

      解讀科學(xué),洞察本質(zhì)

      戳穿忽悠,粉碎謠言

      導(dǎo)讀

      柯潔與AlphaGo的三番棋即將在2017年5月23日上午10:30開(kāi)戰(zhàn)。2017年1月28日,新浪棋牌就本次比賽在深圳對(duì)陳經(jīng)進(jìn)行了視頻專訪。在多次傳出風(fēng)聲之后,二次人機(jī)大戰(zhàn)終于真的要開(kāi)始了??聺嶋m然處于明顯下風(fēng),但并非毫無(wú)機(jī)會(huì)。



      陳經(jīng)


      2017年4月,谷歌DeepMind宣布AlphaGo重出江湖,將在5月在中國(guó)烏鎮(zhèn)與現(xiàn)世界圍棋第一人柯潔展開(kāi)三番棋較量。新浪就此相關(guān)話題采訪了人工智能專家陳經(jīng)(采訪于早些時(shí)候)。

       

        新浪:用幾句話談?wù)勀鷮?duì)圍棋的理解

       

        陳經(jīng):因?yàn)槲沂歉慵夹g(shù)的,所以圍棋在我眼里是所有游戲里最復(fù)雜的一種。我說(shuō)的游戲是“完全信息博弈”游戲的一種,比如中國(guó)象棋、國(guó)際象棋,子力都攤開(kāi)了,大家都打明牌,但是它又很復(fù)雜。這類游戲里圍棋是最復(fù)雜的一個(gè)。

       

        新浪:請(qǐng)您談?wù)勀^看AlphaGo和李世石的人機(jī)大戰(zhàn)以及master的這60盤棋之后的感受?

       

        陳經(jīng):既非常震驚,又非常高興。因?yàn)槲议L(zhǎng)久以來(lái)對(duì)圍棋人工智能的發(fā)展很關(guān)注之前有幾次突破,比如日本的DeepZen能夠戰(zhàn)勝像我這樣的業(yè)余棋手了,但能夠戰(zhàn)勝職業(yè)棋手還是難以想象的,以至于我們期待一個(gè)程序什么時(shí)候能夠戰(zhàn)勝人類的頂尖高手,但忽然之間,好像AlphaGo已經(jīng)實(shí)現(xiàn)了戰(zhàn)勝人類最頂尖棋手的目標(biāo)。這個(gè)進(jìn)度還是超乎了我們的預(yù)期。所以我一方面對(duì)計(jì)算機(jī)算法技術(shù)的進(jìn)步感到震驚,另一方面,有個(gè)人工智能能夠領(lǐng)先人類棋手好像一先,有點(diǎn)科幻色彩,又能夠看到這種棋譜,令人很興奮。因?yàn)槁殬I(yè)高手的棋譜有的時(shí)候就會(huì)顯得千篇一律,但是AlphaGo突破了以前的固有思維,不走尋常路,能夠讓職業(yè)棋手的技藝有飛躍的提升。

       

        新浪:您能否直觀的從技術(shù)的角度讓我們了解AlphaGo在第一次人機(jī)大戰(zhàn)中谷歌公司使用的資源有多么龐大?

       

        陳經(jīng):第一次人機(jī)大戰(zhàn)時(shí)候,AlphaGo是用了分布式版本的一個(gè)機(jī)器,在論文里提到有一個(gè)單機(jī)版,單機(jī)版是一個(gè)小規(guī)模的機(jī)器,它有48個(gè)CPU,以及8個(gè)GPU。

       

        分布式版有1202個(gè)CPU,GPU有176個(gè),比單機(jī)版要多大約幾十倍,從規(guī)模上來(lái)說(shuō)還不是很驚人。真正規(guī)模比較大的是AlphaGo平時(shí)用于訓(xùn)練的機(jī)器,據(jù)我們估計(jì)應(yīng)該是在10萬(wàn)個(gè)服務(wù)器以上。因?yàn)樗珊芏嗥寰郑杂?xùn)練用的機(jī)器CPU以及GPU規(guī)模要大得多。但是下棋的時(shí)候用分布式的機(jī)器和單機(jī)版其實(shí)棋力相差并不是太大。我們得到的數(shù)據(jù)是AlphaGo單機(jī)版對(duì)分布式版也有百分之三十的勝率。

       

        新浪:從技術(shù)的角度怎么看待master快棋的60連勝?

       

        陳經(jīng):我們可以從兩方面看這個(gè)問(wèn)題。一方面是從master對(duì)人類碾壓性的60勝可以看出它是遠(yuǎn)高于人類水平的,這是肯定的。另一方面又是快棋,我們認(rèn)為應(yīng)該是放大了人類的弱點(diǎn)。我們估計(jì)master快棋和慢棋基本實(shí)力不會(huì)差很多,所以是一個(gè)具有完全實(shí)力的master對(duì)的是只有20、30秒的時(shí)間思考的人類,所以人類實(shí)力是打折扣了,而人類對(duì)AlphaGo產(chǎn)生恐懼情緒的話就更容易出現(xiàn)錯(cuò)著。應(yīng)該說(shuō)人類的發(fā)揮并不足以說(shuō)明這是一個(gè)完全的測(cè)試。但有些高手覺(jué)得快棋和慢棋好像也差不多,給他更多時(shí)間他也想不出更好的招法來(lái),或者有些高手說(shuō)快棋和慢棋差一先,這是比較正常的估計(jì)。如果兩個(gè)差距在一先的高手對(duì)局60局取得60全勝也是不太可能的,所以即使人類快棋打折扣我想master和人類的差距應(yīng)該也在一先以上。

       

        新浪:請(qǐng)您來(lái)介紹一下圍棋的AI與象棋、國(guó)際象棋AI有什么區(qū)別?

       

        陳經(jīng):中國(guó)象棋和國(guó)際象棋的AI至少在10年以前用傳統(tǒng)的搜索技術(shù)就已經(jīng)能打敗人類。當(dāng)然它產(chǎn)生轟動(dòng)效應(yīng)該是1997年深藍(lán)與卡斯帕羅夫在國(guó)際象棋領(lǐng)域的突破。那個(gè)時(shí)候在傳統(tǒng)方面的搜索技術(shù)人們還是比較容易理解的。但是到圍棋網(wǎng)面程序就不一樣了。主要是引入了一個(gè)“機(jī)器學(xué)習(xí)”的東西,下棋和評(píng)估局面的過(guò)程都不是用人工代碼寫(xiě)的,而是用“多層神經(jīng)網(wǎng)絡(luò)”來(lái)做計(jì)算的?!岸鄬由窠?jīng)網(wǎng)絡(luò)”在中國(guó)象棋和國(guó)際象棋代碼里是沒(méi)有的。而且AlphaGo用這兩個(gè)神經(jīng)網(wǎng)絡(luò)的系數(shù)是非常多的,多達(dá)幾百兆。AlphaGo更像一個(gè)在人類督促下自我訓(xùn)練慢慢成為高手的人工智能。之前中國(guó)象棋和國(guó)際象棋的AI并沒(méi)有自我對(duì)局的訓(xùn)練過(guò)程。關(guān)于AlphaGo的論文里提到一種技術(shù)叫“強(qiáng)化學(xué)習(xí)”技術(shù)。通過(guò)自己對(duì)弈的過(guò)程修改神經(jīng)網(wǎng)絡(luò)中的數(shù)據(jù),棋力就會(huì)一點(diǎn)點(diǎn)的上升。這是一個(gè)革命性的技術(shù)。

       

        新浪:那您覺(jué)得目前的AlphaGo還有什么弱點(diǎn)?

       

        陳經(jīng):以圍棋的復(fù)雜度來(lái)說(shuō),不可能就說(shuō)master已經(jīng)達(dá)到了完美的程度。Master的60盤雖然沒(méi)輸,但中間有沒(méi)有吃一點(diǎn)虧也還是可以找的到的。比如一開(kāi)始和孟泰齡下的一局可能被孟泰齡的手筋擊中了,導(dǎo)致優(yōu)勢(shì)縮水。所以我們希望能夠繼續(xù)強(qiáng)化AlphaGo,能夠在棋藝上探索出更深層的東西。它是利用一種算法對(duì)局面進(jìn)行評(píng)估,它的論證肯定不是完善的,而是用兩個(gè)幾百兆的神經(jīng)網(wǎng)絡(luò)計(jì)算??隙ú粫?huì)完全接近真理,當(dāng)然有些情況下它的理解比人要深,我們也不排除有些時(shí)候人的理解要比AlphaGo深。所以人一定要有一個(gè)平穩(wěn)的心態(tài),在局面判斷上和AlphaGo進(jìn)行一個(gè)正面的較量。這次柯潔和AlphaGo的挑戰(zhàn)用時(shí)還沒(méi)有商定,我建議用比較長(zhǎng)的時(shí)間比為好。AlphaGo的用時(shí)其實(shí)是無(wú)所謂的,要求時(shí)間完全是為了人類。從棋藝的角度時(shí)間長(zhǎng)也可以讓觀眾看到更精彩的對(duì)局??聺嵄容^容易犯隨手的錯(cuò)誤,經(jīng)常在前半盤領(lǐng)先,但后面就會(huì)開(kāi)始下隨手棋,把大好的局面葬送了出去。如果和AlphaGo下棋發(fā)生下隨手棋這種情況就太可惜了,所以一定要有充足時(shí)間來(lái)杜絕這種情況。

       

        新浪:請(qǐng)您介紹一下圍棋這種完全信息博弈和麻將、德?lián)浞峭耆畔⒉┺牡娜斯ぶ悄軈^(qū)別?

       

        陳經(jīng):完全信息博弈就是所有信息都是攤開(kāi)的,不完全信息博弈是你不知道對(duì)手的信息,所以完全信息博弈的結(jié)果一定是確定的,推理的結(jié)果是一定勝或者負(fù)。在非完全信息博弈里,比如德州撲克、橋牌,AI的思維不是這局我一定要?jiǎng)伲窃谝蝗f(wàn)手牌里會(huì)有一次獲得較高的勝利,所以思維方式是很不一樣的。非完全信息博弈就要引入概率論情況下的搜索技術(shù)。一般認(rèn)為非完全信息博弈的難度是高于完全信息博弈的。人類的優(yōu)勢(shì)更多在于信息不完全的情況下。

       

        新浪:您覺(jué)得AlphaGo對(duì)人工智能發(fā)展的意義是什么?

       

        陳經(jīng):AlphaGo是人工智能歷史上意義最大的幾件事之一。有很多次人工智能都陷入了發(fā)展瓶頸,但這次AlphaGo在一個(gè)看似很困難的領(lǐng)域打敗了人類,似乎挑戰(zhàn)了人類的信心,從算法本身來(lái)說(shuō)AlphaGo也是很有意義的,引入了“強(qiáng)化學(xué)習(xí)”的技術(shù),等于一方面它學(xué)習(xí)了人類的棋譜,另一方面它還可以自我對(duì)局進(jìn)行提升。這樣一個(gè)自我學(xué)習(xí)的框架是人類不能達(dá)到的。人類受身理?xiàng)l件的限制不可能一直下棋,而且人類還可能出現(xiàn)水平下降的情況,但是機(jī)器不會(huì),它是穩(wěn)定提升的。AlphaGo開(kāi)發(fā)出的“訓(xùn)練流水線”,對(duì)人工智能的意義是重大的,之前的人工智能研發(fā)都是小規(guī)模。這次是十幾萬(wàn)臺(tái)服務(wù)器產(chǎn)生海量數(shù)據(jù),這樣一種理念對(duì)整個(gè)人工智能界都是一個(gè)沖擊。

       

        新浪:AlphaGo價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)相配合的這種方式,是否可以應(yīng)該用到更多的領(lǐng)域?

       

        陳經(jīng):AlphaGo下棋首先像人類一樣產(chǎn)生一個(gè)直覺(jué),選擇最有價(jià)值的幾個(gè)選點(diǎn)。另外還對(duì)局面進(jìn)行判斷,對(duì)不同的選點(diǎn)判斷結(jié)果,和人類棋手的思維方式有一定的相似性。如果能將這個(gè)技術(shù)應(yīng)用到其他比如醫(yī)療領(lǐng)域,讓機(jī)器吸收醫(yī)生的經(jīng)驗(yàn)和思維,然后在一些關(guān)鍵的節(jié)點(diǎn)使用策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)做出選擇和判斷。研究AlphaGo更大的意義是為了在醫(yī)療程序上取得突破,實(shí)際上他們團(tuán)隊(duì)已經(jīng)有很多人轉(zhuǎn)去做醫(yī)療程序了。AlphaGo在策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)已經(jīng)得到驗(yàn)證的訓(xùn)練方法是很有價(jià)值的,已經(jīng)在醫(yī)療程序上有所應(yīng)用了。谷歌可能會(huì)投入更多精力到其他領(lǐng)域。

       

        新浪:您覺(jué)得從master現(xiàn)身到挑戰(zhàn)柯潔這段時(shí)間能否再次完成實(shí)力上的飛躍或者說(shuō)算法上的升級(jí)?

       

        陳經(jīng):我覺(jué)得存在兩種可能性,一種從它本身的架構(gòu)來(lái)說(shuō),它每天都在自我對(duì)局,這個(gè)提升肯定不會(huì)停止,但這個(gè)過(guò)程能否使AlphaGo的棋力有本質(zhì)的提升是不確定的,因?yàn)槿魏巫晕姨嵘际怯幸粋€(gè)上限的,它是有一個(gè)曲線的過(guò)程,一開(kāi)始進(jìn)步很快,后面會(huì)趨于平緩,如果AlphaGo的水平已經(jīng)到了一定程度的話,給它再多的時(shí)間也很難有所提升。還有另外一種可能性,引入一種新的技術(shù),重新開(kāi)始新的訓(xùn)練,研發(fā)產(chǎn)生算法實(shí)力的本質(zhì)飛躍也是可能的。

       

        新浪:有一種觀點(diǎn)說(shuō)AlphaGo的代碼在人工智能領(lǐng)域并不算大工程,自動(dòng)駕駛領(lǐng)域需要的代碼很多,比AlphaGo的代碼要多很多,這種觀點(diǎn)您怎么看?

       

        陳經(jīng):這種觀點(diǎn)是完全正確的,AlphaGo應(yīng)該比之前的圍棋程序代碼量還要少,但是AlphaGo的神經(jīng)網(wǎng)絡(luò)的系數(shù)特別多,高達(dá)幾百兆,人寫(xiě)代碼不可能達(dá)到這么多。AlphaGo的棋力秘密是隱藏在它的兩個(gè)神經(jīng)網(wǎng)絡(luò)里,不可能通過(guò)代碼得到,而是通過(guò)十幾萬(wàn)臺(tái)服務(wù)器將數(shù)據(jù)灌注到神經(jīng)網(wǎng)絡(luò)的系數(shù)里,所以它不是一個(gè)簡(jiǎn)單的工程。

       

        新浪:您如何看待AlphaGo與柯潔的這個(gè)慢棋對(duì)決?

       

        陳經(jīng):這次AlphaGo和之前與李世石對(duì)局不同,之前并沒(méi)有公布太多的棋譜。這次和柯潔對(duì)戰(zhàn)有60局高質(zhì)量的棋譜,而且取得了60比0的勝利,應(yīng)該完全展現(xiàn)了它的實(shí)力。人類對(duì)柯潔的預(yù)期也是比較一致的:柯潔如果能取得一局的勝利應(yīng)該已經(jīng)算很大的一個(gè)成功了。如果柯潔全負(fù)也不是一件很震驚的事情。之前是AlphaGo挑戰(zhàn)李世石,甚至有人說(shuō)一盤都不能讓AlphaGo贏,而這次是柯潔如果能夠取勝一盤就表明AlphaGo還存在缺陷,讓AlphaGo繼續(xù)提升,到最后和國(guó)際象棋一樣宣稱不可能輸給人類了。當(dāng)然我相信現(xiàn)在還沒(méi)達(dá)到這種程度??聺崒?duì)AlphaGo能夠有1到2局勝利對(duì)職業(yè)棋手來(lái)說(shuō)是件很歡欣鼓舞的事情。

       

        新浪:既然現(xiàn)在AlphaGo已經(jīng)如此強(qiáng)大,為什么還要和柯潔對(duì)戰(zhàn)?

       

        陳經(jīng):首先谷歌公司二老板個(gè)人對(duì)圍棋是非常感興趣的,包括AlphaGo和李世石對(duì)戰(zhàn)的時(shí)候還親自到了韓國(guó)。即使不考慮勝負(fù),從棋藝本身來(lái)說(shuō)也是非常有價(jià)值的。只有在慢棋這種比較公平的測(cè)試情況下才能夠不僅讓職業(yè)棋手信服,也讓開(kāi)發(fā)團(tuán)隊(duì)比較有信心。谷歌團(tuán)隊(duì)在這方面還是比較保守的和謙虛的,在沒(méi)有充足的證據(jù)時(shí)不會(huì)做出夸張的宣稱。Master60連勝后他們只是說(shuō)一起和職業(yè)棋手探討圍棋中美妙的部分。

       

        新浪:請(qǐng)您給柯潔一些建議

       

        陳經(jīng):首先柯潔的目標(biāo)應(yīng)該是對(duì)AlphaGo取得一局勝利就成功了,他應(yīng)該作為一個(gè)完全挑戰(zhàn)的心態(tài)準(zhǔn)備這次比賽,這有利于他實(shí)力的發(fā)揮。同時(shí)他必須對(duì)AlphaGo下棋的過(guò)程有了解,如果不知道對(duì)手是怎么做出決策的就會(huì)感到慌張,所以一定要把AlphaGo看成一個(gè)可以理解的對(duì)手。和懂算法的人進(jìn)行交流,理解AlphaGo的思維。第二,如果AlphaGo在中盤取得優(yōu)勢(shì),不建議柯潔糾結(jié)于如何收官子,應(yīng)該把決勝點(diǎn)放在前半盤,當(dāng)然后半盤要頂住,不能將優(yōu)勢(shì)葬送??聺崙?yīng)該主動(dòng)把局面倒向自己擅長(zhǎng)的部分,應(yīng)該建立信心,對(duì)一些局面自己估算比AlphaGo要準(zhǔn)確的時(shí)候,要相信自己確實(shí)取得了優(yōu)勢(shì)。(文玄)

      背景簡(jiǎn)介文作者筆名陳經(jīng),香港科技大學(xué)計(jì)算機(jī)科學(xué)碩士,科技與戰(zhàn)略風(fēng)云學(xué)會(huì)會(huì)員,微博@風(fēng)云學(xué)會(huì)陳經(jīng),文章2017年5月17日發(fā)表于新浪微博(https://sports.sina.com.cn/go/2017-05-17/doc-ifyfeius8031558.shtml)。

      責(zé)任編輯孫遠(yuǎn)



      閱讀

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多