啊繾的柚子:
NVIDIA:
蟲蟲v2:
大家好。這次我們要談的主題啊是一個超級熱的主題,也就是近年來整個科技界可以說最熱的一個關(guān)鍵詞,你肯定知道是什么了吧?就是人工智能。你也許要問了,那我以前為什么不談人工智能?原因很明顯,因為我完全不是一個人工智能專家。我對于人工智能所知甚少,那這一期為什么要談一談呢?因為一方面是因為世界人工智能大會要在中國上海市召開,這是全世界人工智能界一個盛會。( 袁嵐峰博士應(yīng)上海電視臺之邀探營世界人工智能大會的視頻見科技袁人上一期,鏈接: https://mp.weixin.qq.com/s/6rvnfJNlZPBxD8DeweeIvw) 為了準(zhǔn)備這個事情,我也去咨詢了一些人工智能方面真正的專家,麻省理工大學(xué)評出的中國“35歲以下科技創(chuàng)新青年35人”,朱明杰博士,一見面他就叫我?guī)熜?,哦這又是我們科大師弟,然后跟他聊起來好多做人工智能的都是科大師兄弟。經(jīng)常談到的,我的朋友風(fēng)云學(xué)會會員陳經(jīng),他就是做人工智能研究的,他就是一個人工智能的開發(fā)者。然后另外一位是我的科大師兄,加州大學(xué)洛杉磯分校的計算機科學(xué)與統(tǒng)計學(xué)教授朱松純老師。我以前向大家介紹過,朱松純老師寫過一篇4萬字非常長的一個對于人工智能的非常全面介紹,這個文章呢叫做《淺談人工智能》,名字叫淺談,但實際上它是我見到的對于人工智能最深入的介紹。那么一個最基本的問題,就是人工智能現(xiàn)在是一個什么樣的發(fā)展?fàn)顩r呢? 你也許啊會在很多地方看到,說這個人工智能馬上就要超過人了,甚至說要取代很多人的工作了,然后很多人關(guān)心人工智能并不是因為他們對這個科技發(fā)展感到多么歡欣鼓舞,而是出于一個憂慮:啊我的工作明天就沒了。就好像以前看到一個電視節(jié)目,這個撒貝寧跟人工智能專家座談。人工智能專家就說我們非常有信心,五年之內(nèi)很多的工作就會取代,然后撒貝寧說那我的工作呢,他說你呢大概三年,然后小撒就一臉很悲壯的,啊我只剩三年了。實際上呢這都是開玩笑的,實際上你如果去問業(yè)界的專家,你會得到印象正好相反。他們真正關(guān)心的是人工智能能做的事太少,而不是太多。 那種討論這個人工智能取代人類,人工智能消滅人類。這個種種哲學(xué)性的問題呢。他往往不是研究人工智能的。比如說朱松純教授在他這個文章一開頭呢就說到,媒體現(xiàn)在對于人工智能的夸大宣傳已經(jīng)到了讓他們這些人非常吐血的程度。比如說經(jīng)常被媒體拿出來說的人是霍金,當(dāng)然霍金先生已經(jīng)去世了?;艚鹚歉墒裁吹??他是一個物理學(xué)博士,是研究黑洞的,研究宇宙學(xué)的。他從來沒有搞過人工智能??;而且他已經(jīng)患漸凍人癥那么多年,本來他的科研就沒法做了,結(jié)果你把它當(dāng)成一個人工智能的專家出來,讓他大談特談人工智能的危險,你不覺得這很搞笑嗎? 斯蒂芬·霍金 還有就是埃隆·馬斯克,馬斯克呢他也不是研究人工智能的,所以你為什么要把這些人的觀點看特別重要?其實你更應(yīng)該看看那些真正研究人工智能的人。如果去看那些真正研究人工智能的人,你會發(fā)現(xiàn)他們有一種戒慎恐懼的心理。他感覺這個媒體把人工智能說的太過了。實際上人工智能呢在它發(fā)展歷程當(dāng)中,已經(jīng)經(jīng)過了好幾次的高漲和好幾次的寒冬。實際上人工智能是20世紀(jì)50年代開始出現(xiàn)的這么一個學(xué)科,然后在這中間這個發(fā)展?fàn)顩r,用朱松純的話說就是Boom and Bust。是西方經(jīng)常這么形容,就一哄而上,然后又一哄而散,每次都是大家對他寄予一個過高的期望,然后一大堆人來了,然后過一段時間發(fā)現(xiàn)研究不出來,遠遠達不到期望,然后大家一會又全跑了。 比如說在朱松純80年代剛開始學(xué)人工智能的時候,他是1986年上的科大,那時候呢人工智能處于一個非常悲催的境地。那時候沒有人好意思說自己是搞人工智能的,那你就說了那這些人當(dāng)時在干嘛呢?他們會自稱自己是搞計算機科學(xué)的,或者是搞數(shù)學(xué)的。然后你再問他具體干什么,他會說我是搞計算機視覺的,或者諸如此類一個非常具體的領(lǐng)域,他絕對不會告訴你他是搞人工智能的。在那個時候人工智能這個詞幾乎都被污名化了。所以在這個行業(yè)里面堅持到現(xiàn)在的人,忽然發(fā)現(xiàn)近幾年來人工智能這詞變得如此之熱,然后許多外行都趨之若鶩,然后任何人任何企業(yè)都覺得只要沾一下人工智能這個詞就變得高大上起來,市場估值就可以翻幾番。他會覺得非常不可思議,夢幻般的體驗。 實際上呢我在合肥市委黨校講課的時候,我去講量子信息,結(jié)果講完之后,立刻就有一位非常熱心的學(xué)員起來提問,他問的是量子計算跟人工智能是有什么關(guān)系?量子計算能不能幫助人工智能突破現(xiàn)在的弱人工智能達到強人工智能以至于達到將來的超人工智能。我說:哇這個問題提得很好。確實是,當(dāng)然任何人都能看出來,這兩者肯定是有關(guān)系的,如果量子計算機造出來了,當(dāng)然是有助于人工智能的實現(xiàn),不過前提是你能造出來嘛。你得完全分清楚,這兩個技術(shù)不同的層次,量子計算這是一個有原理,但是實踐當(dāng)中還有巨大困難的技術(shù),還完全沒到實用階段,只是在一個實驗室演示的階段。 而人工智能呢是一個真實在用的技術(shù),大家都用了這么多了,比方說AlphaGo在下棋,還有像無人駕駛很多技術(shù)都是真的能用的嘛。無論有沒有量子計算,人工智能都會繼續(xù)發(fā)展。當(dāng)然了如果有量子計算當(dāng)然是個好事,不過前提是你得能造出來。所以啊那我們來講點干貨,人工智能的業(yè)界它實際是一種什么發(fā)展?fàn)顩r呢? 陳經(jīng)就告訴我了。實際上大部分的人工智能研究,應(yīng)該說應(yīng)用,就是你整天在媒體上看到說人工智能又做到這個又做那個,下棋又贏了,打游戲又贏了。這些事情都是一種比較簡單的技術(shù)路線,就是說收集大量的數(shù)據(jù),比方說有很多人發(fā)動了幾百萬人去標(biāo)注數(shù)據(jù),搞那圖片識別的。然后大量的數(shù)據(jù)來訓(xùn)練,然后去做一個,這實際上是相當(dāng)于一個擬合的工作,就是有一個多元函數(shù),然后你不知道這個函數(shù)結(jié)構(gòu)長什么樣的,但是沒關(guān)系,你從大量的數(shù)據(jù)去擬合,就是神經(jīng)網(wǎng)絡(luò)那個思想,然后最后擬合出來的結(jié)果,你可以對一個輸入給出一個很好的輸出,你可以識別出來,這是個什么東西了,甚至比人的識別能力還要高。 這當(dāng)然很好,但是這個前提是說因為你有個很大的數(shù)據(jù),而且呢你也不知道因果關(guān)系,但是總體這樣是可以用的,很多時候你是可以超過人的。這是絕大多數(shù)的人工智能研究是這么做的。 陳經(jīng)說呢這是一個比較低級的路線,現(xiàn)在出現(xiàn)了一種比較高級的路線,就是AlphaGo那種路線。他說這個大數(shù)據(jù)呢我們還是要用大數(shù)據(jù),但是這個大數(shù)據(jù)不是靠人工標(biāo)注了,不是去發(fā)動了全世界數(shù)以百萬計的研究生去做這個人工標(biāo)注,而是讓機器自己跟機器博弈,然后讓它自動去生成數(shù)據(jù)。你看AlphaGo后來為什么變得那么強? AlphaGo一開始是學(xué)習(xí)人類的棋譜,到后來呢它再次升級之后變成AlphaGoZero,為什么叫AlphaGoZero呢。因為它不再學(xué)習(xí)人類棋譜了,它從頭開始,你唯一給它輸入的就是圍棋的規(guī)則,然后它根據(jù)規(guī)則自己跟自己對弈,然后很快就積累了數(shù)據(jù),然后很快它就找到了這個圍棋最好的做法,然后超越了人類所有的棋手,這時人類棋手是遠遠地瞠乎其后。 現(xiàn)在都變成人類要向AlphaGo要向計算機的棋手來學(xué)習(xí)怎么下圍棋。計算機棋手不需要向人類學(xué)習(xí)任何東西了,這是一個現(xiàn)在比較高級的技術(shù)路線。它對于研發(fā)能力要求是很高的,尤其是對于計算能力要求是很高的。但是AlphaGo這個團隊最大的貢獻,就是證明了這樣一條技術(shù)路線是可行的。 阿爾法Go與李世石 所以人工智能確實是取得巨大進步,在很多行業(yè)都刷新了以前記錄,都做到以前做不到的事情,比方說人臉識別。這個人臉識別本來應(yīng)該是人的強項是吧?但很長時間,其實人臉識別大家已經(jīng)做了幾十年了,很長時間,計算機是達不到人的水平的,它實際上就沒有多大用處。 但是像這個商湯科技湯曉鷗,他也是我們科大一位師兄。湯曉鷗呢是第一個做出一個算法,使人臉識別,機器的這個識別率超過人。這樣突破這個臨界值了,然后人臉識別立刻就得到爆炸性的應(yīng)用,現(xiàn)在比方說你去任何一個地方,你去一個賓館住店,他第一件事他都會掃一掃,讓你看一下攝像頭來識別一下你是不是就身份證上那個人,這些變成一個非常常用的技術(shù)。像這種啊你就并不需要他那個基本原理有多大突破,只需要他那個應(yīng)用的指標(biāo)突破了某個水平,比方說超過了人的水平,那他就非常重要的經(jīng)濟上的意義了。但是這是不是就夠好呢?如果在研究人工智能理論的人看來,這當(dāng)然還遠遠的不夠好。 如說像朱松純教授,以及他在文章里面多次引用的他的一些前輩,比如說Judea Pearl教授,他們就一再向大家指出,當(dāng)前的所有的人工智能其實在專家看起來完全沒有智能。這當(dāng)然要看你怎么定義智能了,但是這它實際的意思是說,當(dāng)前這個人工智能它唯一做的都是分析數(shù)據(jù),都是你給他大數(shù)據(jù),然后它從中去學(xué)習(xí),然后最后學(xué)出來一套基于大數(shù)據(jù),它做的超過人了,但是你覺得這是我們?nèi)祟悓W(xué)習(xí)一個知識的方法嗎? 其實壓根不是啊。朱松純在他這文章里面就舉了一個非常有意思的例子,說烏鴉和鸚鵡。大家知道這個烏鴉和鸚鵡呢是兩種鳥類,它們的體型和大小都差不多,但是朱松純告訴大家,烏鴉就比鸚鵡要聰明得多。為什么呢?你說你看起來鸚鵡好像很有智能,你就跟這個鸚鵡說話,然后把一句話重復(fù)幾次之后,鸚鵡就學(xué)會了,鸚鵡學(xué)舌嘛。鸚鵡可以模仿人類說話,說得也很好。但是你如果跟這個鸚鵡去對話,嘗試上幾次,你就會發(fā)現(xiàn)其實鸚鵡完全不知道自己在說什么,因為它根本不理解它說的那些東西,它是一個機械的重復(fù)而已。 現(xiàn)在其實你可以看到很多所謂聊天機器人,你平時能夠見到唯一的在日常生活當(dāng)中能夠見到的所謂人工智能應(yīng)用,就是這個聊天機器人。網(wǎng)上呢也會傳很多的聊天機器人的視頻啊、圖片啦、文字記錄啦,你乍一看的時候你會覺得非常的驚艷,你說哇這個聊天機器人這么聰明啊。它是不是已經(jīng)是具有人類自我意識了,它是不是已經(jīng)通過圖靈測驗了?完全沒有啊。 比方說有人給我看一個說是英國開發(fā)的一個聊天機器人叫做索菲亞,這聊天機器人聊得這么好,以至于沙特阿拉伯給了她一個沙特阿拉伯的國籍,當(dāng)然是機器人的國籍。說這是歷史上第一次有一個機器人被授予了一個國籍的,然后給大家看,聊得很嗨啊。像這種你不能跟她多聊,聊的多了,你就會發(fā)現(xiàn)它其實就是東拉西扯,來回就那幾句,你可能就發(fā)現(xiàn)它其實并不知道自己在說什么。
那反過來說朱松純?yōu)槭裁凑f烏鴉就非常聰明,他給大家舉個例子說,他說的烏鴉啊都是真實世界的烏鴉,都是有人拍下來的,比方說他看到有一只烏鴉,這個烏鴉呢拿到一個堅果,它想吃到這個堅果里面那果實,但是呢啄不開這個果殼,它怎么辦呢?然后它就做了一個觀察,它發(fā)現(xiàn)啊這個堅果如果落在公路上面,有一個汽車壓過去,果實不就出來了嗎?好。它做出這個觀察,但是呢,然后它也意識到,這樣汽車在來來往往的時候,它不能去吃這個果實,因為太危險了,隨時它就掛了。然后它又做了一個觀察,它發(fā)現(xiàn)馬路上是有紅綠燈的,當(dāng)紅燈的時候汽車就不走,這個時候它就可以去吃那個果實,就非常安全。然后它還需要做一個推論,就是在這個紅綠燈地方觀察到的事情,在另外一個紅綠燈那也能行。所以呢它最后就做出這么一個決策,它把堅果叼到某個紅綠燈的地方,在綠燈的時候放下去讓汽車把它壓碎,然后在紅燈的時候下去吃,然后它就真的就吃到了。你說這是多么聰明的一只烏鴉。人看到這個例子會說:哇這個是表現(xiàn)出真正的智能。但是烏鴉做事的范式呢跟我們平時理解的人工智能的那種做事范式正好相反,朱松純就指出我們絕大多數(shù)做人工智能的研究者都是大數(shù)據(jù)小任務(wù),Big data Small task。 烏鴉學(xué)習(xí)歷程 烏鴉正相反,它是小數(shù)據(jù)大任務(wù),你說烏鴉有什么大數(shù)據(jù)呢?它只是觀察了屈指可數(shù)幾個例子而已,因為它的生命只有一次,它不能自己跑到紅綠燈那地方自己去多做幾次實驗,它早不知道被碾死多少次了。所以真正的智能是能夠通過很小的數(shù)據(jù),就能提煉出當(dāng)中的規(guī)則,然后就能夠進化出,立刻就推演出一個非常好的做法。 它為什么能夠做到這一點?因為它有因果關(guān)系,而傳統(tǒng)的人工智能純粹是一個統(tǒng)計,它是做的一個相關(guān)性的分析。那比方說公雞打鳴,太陽就會升起,這兩者之間是一個相關(guān)性的關(guān)系,但是我們并不會認(rèn)為這兩者之間是因果性的關(guān)系,對吧?假如你把全世界的公雞都給殺掉了,太陽也不會不升起,對吧?或者你強迫全世界所有公雞在半夜打鳴,太陽也不會半夜就升起,對吧?所以這樣的事情呢只是相關(guān)性不是因果性。 又比如說呢如果下雨那有很大的概率地面就濕了,OK但是假如我們反其道而行之,我們?nèi)斯さ娜グ堰@個地面打濕了,那你覺得會有很大概率下雨嗎?這好像完全不相關(guān),對吧?所以像朱松純和他這位前輩JudeaPearl就向大家強調(diào),因果的邏輯跟相關(guān)的邏輯是不一樣的。我們?nèi)绻胝娴倪_到一個智能的程度,你應(yīng)該用一種數(shù)學(xué)語言明確的把這種因果的邏輯描述出來。 但是這個因果和相關(guān)區(qū)別在什么地方?他說這關(guān)鍵是在于因果性,我們是在討論一個帶有可能性的世界,是多個世界,而相關(guān)性是只有一個世界,那個世界發(fā)生了什么就是什么,你不能去改變它,所以那只有一個世界。你可以對這個世界所有一切都了如指掌。但是由于你不能改變它,所以你沒法說這其中任何兩件事件有因果關(guān)系。 而一個因果性的世界是說我們可以介入,我們會做出一些反事實的推理,我們會說假如我們當(dāng)初那么做,那么這個事情可能會發(fā)生什么樣的變化。當(dāng)我們能夠這么設(shè)想,然后去做一些實驗去驗證的時候,我們才是在做一個因果性的推理。 朱松純建立一個非常浩大的人工智能的一個框架性的思考,他說在這當(dāng)中我們應(yīng)該考慮兩件事,一個是這個物理規(guī)律,就是這個物理世界,那些自然界的規(guī)律,比如說一個東西要怎么才能放得穩(wěn),它需要一個什么樣的支撐。然后另外一個是人的動機,這個是來驅(qū)動人去做思考做事情的動力。比方說人做圖像識別,他在識別什么?其實最根本的識別是功能。比方說一眼就可以看出來,這個地方是廚房,那個地方臥室,那個地方是書房,他首先想到是這個地方是干什么的,從此出發(fā),他立刻就能看出這個圖片的很多特征。 比方說你可以看出一個現(xiàn)代人的廚房,跟一個古代人的廚房,雖然看起來外表相差甚遠,你如果要計算機去識別,它根本不會認(rèn)為這兩個是同樣的東西,它模式識別,它怎么都看不出來,但是人一眼就看出來,這玩意都是廚房,它的功能是一樣的。這是因為人能夠分出這背后的因果關(guān)系,然后以這兩個特征朱松純就稱應(yīng)該把牛頓和達爾文統(tǒng)一起來。牛頓就是物理世界的規(guī)律,達爾文就是生物世界的規(guī)律。然后你把這個物理世界的因果性跟這個生物世界的基于這種動機價值觀的因果性結(jié)合起來,這個才是關(guān)于人工智能或者說的更廣泛一點,他希望把這個人工智能提升到一個科學(xué),就是關(guān)于智能的科學(xué)The Science of Intelligence這樣一個程度,他覺得這應(yīng)該是未來的人工智能科學(xué)的一個思考的一個框架性的出發(fā)點。 古今廚房 我覺得這是非常高妙的一種思考。然后我就問陳經(jīng)了,那你覺得我們的朱松純師兄說的這些怎么樣?他說說的當(dāng)然是很好,業(yè)界都是非常敬佩朱松純的,不過他說的也許在目前改變不了業(yè)界大多數(shù)人做法,就是說朱松純其實非常鄙視那些刷榜的人,就是說你下載了人家的軟件,下載人家代碼,然后呢搞一個很大的數(shù)據(jù)集,然后搞一大堆人去調(diào)參數(shù),然后最后呢你刷出來的結(jié)果,你把識別率又提高多少個百分點,然后超越別人。這業(yè)界發(fā)的絕大部分文章都是這種,他實際上很看不起這種,湊熱鬧,這個東西跟科研相去甚遠。但是朱松純說的再好也改變不了,大多數(shù)人還是會做這個事情,為什么呢? 因為這個事情確實有用,你如果把人工智能看成一個工程看成一個實踐,那么這些事情就是當(dāng)前最有用,而且確實非常有成果,而且主要它并不是人工智能這個領(lǐng)域本身的人在孤芳自賞,是因為有很多其他領(lǐng)域存在這個現(xiàn)實的需求嘛。所以他們會希望大家用人工智能應(yīng)用去幫助他們做到各種各樣的事情,不管是醫(yī)療、圖像識別、還是無人駕駛。很多領(lǐng)域它都有這個需求,所以人工智能它的發(fā)展其實在當(dāng)前這個階段,更多的是人工智能專家跟各個行業(yè)的專家,大家來共同研討,做一個深入的溝通。知道每一個行業(yè)里邊他們真正的問題是什么,然后基于這個行業(yè)的專業(yè)知識跟人工智能專業(yè)知識大家結(jié)合起來,然后這樣就可以一塊取得突破。 所以你可以理解為人工智能幫助很多已經(jīng)有深厚積累的領(lǐng)域做出了突破,那個功勞其實有一大半是那個領(lǐng)域自己的,但人工智能幫它完成這個臨門一腳。這樣的工作確實非常有用,所以大家還會持續(xù)不斷做下去。朱松純說的可能一時半會不會改變這個狀況,不過呢我們應(yīng)該這么想,就是一個學(xué)科的發(fā)展,它是要有理論提供一個框架,然后有實踐去不斷來消化這個理論的成果。然后很可能消化一個理論需要很長很長時間,但是呢最終你整個學(xué)科能夠達到的上限,還是取決于你的理論框架。 比方說,我就聽到過這樣說法,說人類在20世紀(jì)初的時候做出了相對論和量子力學(xué)這兩大科學(xué)革命,然后直到現(xiàn)在呢相對論和量子力學(xué)都是人類兩個最最基礎(chǔ)的物理學(xué)理論。那有趣的事情就是人類直到現(xiàn)在都沒有充分的消化這兩個科學(xué)革命的后果。你看比方說量子科技,實際上指的是量子信息啦,現(xiàn)在發(fā)展的還是非常方興未艾,或者按照他們比較業(yè)內(nèi)人的說法,叫第二次或者是第三次量子革命。 那么也就是說對于量子力學(xué)這個已經(jīng)有一百多年歷史的理論,大家還在不斷地發(fā)掘出其中出人意料的以前沒有想到的新的內(nèi)涵。就是說我們消化的還遠遠不夠呢。所以呢就有人猜想,我們現(xiàn)在還沒有出現(xiàn)一個新的科學(xué)革命,大概就是因為我們還沒有把上一次科學(xué)革命的那個成果消化殆盡吧。 但是說到底呢最最根本的你能夠達到上限還是取決于那個理論框架,這不就像三體里面講那個基本的故事嗎?智子并不需要鎖死人類所有的科技發(fā)展,它只是需要鎖死那個最最基礎(chǔ)的高能物理學(xué),或者說粒子物理學(xué)就足夠了,你就沒法再發(fā)現(xiàn)更深入的層次。 三體 智子 以當(dāng)羅輯沉睡了數(shù)百年之后,醒過來,他發(fā)現(xiàn)乍一看好像覺得人類已經(jīng)發(fā)展得非常先進了,結(jié)果他就問大史,大史其實也不懂什么科學(xué)了,但大史立刻就指出,這沒有任何奇怪的,他們只不過突破了一樣?xùn)|西,就是可控核聚變。相當(dāng)于他有無限能源了,然后它通過無線輸電到處給你輸電,然后就看到好像能夠?qū)崿F(xiàn)很多不可思議的事情,其實一點都不難。真正令人感到恐懼的是基礎(chǔ)物理理論沒有進展,比方說羅輯醒來一看,丁儀教授你還在教物理!你還是一個物理學(xué)教授,你沉睡了幾百年之后,你掌握的知識還是最高深的。這個其實是令人可悲的是吧?所以我們也認(rèn)為像朱松純教授做的這種框架性的思考,這種引領(lǐng)未來的思考也是非常有必要的,將來我們需要更多的這種級別的思考。 |
|