*如何訂閱我們? ------------------------ 文丨李曉毅 近來網(wǎng)上滿是有關(guān)AlphaGo和李世石對弈的討論,實(shí)際上,機(jī)器學(xué)習(xí)在過去的十多年中早已被廣泛應(yīng)用,常用于網(wǎng)絡(luò)搜素、垃圾信息過濾、廣告更替、詐騙偵測、股票交易以及藥物設(shè)計(jì)等很多應(yīng)用上。根據(jù)麥肯錫對此的分析預(yù)測,機(jī)器學(xué)習(xí)將引發(fā)第二波的創(chuàng)新浪潮。那么機(jī)器學(xué)習(xí)到底是如何完成的?人類的教育又將在哪些領(lǐng)域變得更為重要? 機(jī)器學(xué)習(xí)到底是什么,它是如何完成的?機(jī)器學(xué)習(xí)的理論是,設(shè)計(jì)一些讓計(jì)算機(jī)能夠自動(dòng)學(xué)習(xí)的算法。能夠通過從大量的前期的實(shí)例中學(xué)習(xí)歸納并總結(jié)出規(guī)律,并以此做出如何處理之后的任務(wù)的決定(圖示1)。 目前業(yè)界的機(jī)器學(xué)習(xí)根據(jù)所要完成的任務(wù)可以分成以下幾類: 監(jiān)督學(xué)習(xí):計(jì)算機(jī)從給定的大量數(shù)據(jù)(訓(xùn)練集)中學(xué)習(xí)總結(jié)出一個(gè)規(guī)律(一個(gè)函數(shù)),當(dāng)新的數(shù)據(jù)到來時(shí),可以根據(jù)這個(gè)規(guī)律(函數(shù))預(yù)測出結(jié)果。訓(xùn)練集包括輸入和輸出,也可以說是特征和目標(biāo)。 無監(jiān)督學(xué)習(xí):計(jì)算機(jī)從給定的數(shù)據(jù)里分析出數(shù)據(jù)本身蘊(yùn)藏的結(jié)構(gòu)。數(shù)據(jù)挖掘就屬于這類學(xué)習(xí)。 增強(qiáng)學(xué)習(xí):計(jì)算機(jī)通過觀察來學(xué)習(xí)做出什么樣的動(dòng)作。每個(gè)動(dòng)作都會(huì)對環(huán)境有所影響,學(xué)習(xí)對象根據(jù)觀察到的周圍環(huán)境的反饋來做出判斷。 如果從機(jī)器學(xué)習(xí)后的執(zhí)行任務(wù)的結(jié)果來看的話,還存在這樣的分類: 分類法:數(shù)據(jù)(訓(xùn)練集)被分成一個(gè)或者多個(gè)類別,機(jī)器必須生成一個(gè)模型用來分配訓(xùn)練集之外的數(shù)據(jù)到其中一個(gè)或者多個(gè)類別里。這就是監(jiān)督學(xué)習(xí)的方法。 回歸法:和分類法不同的是,它要求的數(shù)據(jù)都是連續(xù)的而不是離散的。這也是監(jiān)督學(xué)習(xí)的方法。 (圖示1) 假設(shè)你有一個(gè)程序或者想法希望用機(jī)器學(xué)習(xí)系統(tǒng)來完成,你面臨的最大問題是五花八門的計(jì)算算法。目前業(yè)界有成千上萬個(gè)現(xiàn)有的算法,同時(shí)每年都會(huì)有上百個(gè)新的算法被發(fā)布。如何從中甄別出最適合自己的呢? 其實(shí)如此眾多的算法都可以在概念上歸結(jié)為以下三個(gè)必要模塊: 表述:首先一個(gè)分類器必須以計(jì)算機(jī)可以理解的語言表述出來。并且,為分類器(圖示2)選擇一個(gè)合適的表述本身就相當(dāng)于選擇一系列的能夠?qū)W習(xí)的分類器。這一系列的分類器可以叫做學(xué)習(xí)系統(tǒng)的假設(shè)空間。如果任何一個(gè)分類器不在這個(gè)空間內(nèi),那它是不會(huì)被系統(tǒng)學(xué)到的。 評估:系統(tǒng)里要有一個(gè)能夠分辨分類器好壞的評估功能。 優(yōu)化:最后,還需要一個(gè)方法來搜索出評分最高的那個(gè)分類器。選擇出一個(gè)優(yōu)化技術(shù)最佳的方案是提高學(xué)習(xí)系統(tǒng)效率的關(guān)鍵。同時(shí)也可以在評估功能得出數(shù)個(gè)較好的分類器方案后,給最終方案的決定做出幫助。通常的情況是:一個(gè)新的學(xué)習(xí)系統(tǒng)開始使用一些現(xiàn)有的優(yōu)化方案,之后會(huì)改成一個(gè)專門定制的方案。 (圖示2) 因篇幅有限,機(jī)器學(xué)習(xí)大體的概念就討論到這里。借鑒Facebook人工智能專家田淵棟的分析,AlphaGo的算法中,對于監(jiān)督學(xué)習(xí)方面下的力度比較大,增強(qiáng)型學(xué)習(xí)所扮演的角色沒有想象中大,神經(jīng)網(wǎng)絡(luò)的應(yīng)用也不大,反倒是最傳統(tǒng)的局部特征匹配和線性回歸使用較多。對棋盤的局的分析訓(xùn)練高達(dá)三千萬局,且使用的也是傳統(tǒng)的暴力訓(xùn)練。所以算法沒有過時(shí)之說,任何算法都有它的用武之地。 很多人把這次的對弈比喻成機(jī)器智能和人類智能的對弈。筆者感覺這樣的說法失之偏頗。機(jī)器智能和人類智能的對弈只不過是思維的不同形式的較量。因?yàn)锳lphaGo畢竟是按照人類給予的邏輯去下棋的。它僅是在已有的邏輯背景下通過超高速的計(jì)算來獲勝的。這就和人類設(shè)計(jì)飛機(jī)和汽車可以大大拓展人的活動(dòng)范圍一樣。 盡管如此,我們還是可以在這幾次和過往的人機(jī)對弈以及目前的科技浪潮中看出,機(jī)器智能的優(yōu)勢和潛力。最顯著的優(yōu)勢就是機(jī)器的處理速度。生物神經(jīng)元的傳導(dǎo),在200赫茲,200次/秒。但即使是現(xiàn)在的晶體管也運(yùn)行在千兆赫茲。神經(jīng)元軸突傳播緩慢:100米/秒,這已是上限。但計(jì)算機(jī)信號(hào)可以以光速傳導(dǎo)。除此之外,人類的智能還有個(gè)空間的限制。人類的大腦受到顱骨大小的限制。但是計(jì)算機(jī)的機(jī)體可以大到一個(gè)倉儲(chǔ)式超市甚至更大。因此,智能計(jì)算機(jī)的潛力還處于休眠狀態(tài),就像原子的力量一直在整個(gè)人類歷史處于休眠狀態(tài),耐心地等待著,直到1945年。 既然人工智能有這樣的潛力,對人類是福是禍?人類在未來如何應(yīng)對?未來機(jī)器人和人類共存會(huì)是個(gè)常態(tài)。我們的下一代應(yīng)該具備什么樣的能力去迎接和適應(yīng)一個(gè)處處是人工智能的未來呢? 人工智能的出現(xiàn)必將取代很多傳統(tǒng)的工作,同時(shí)也在不斷地創(chuàng)造新工作。而新創(chuàng)造的工作必定需要能夠掌控未來人工智能技術(shù)發(fā)展的人才。該如何為下一代的未來選擇更能適應(yīng)未來的教育呢?這應(yīng)該是大家需要認(rèn)真思考的問題。 人類的教育在哪些領(lǐng)域?qū)⒆兊酶鼮橹匾?/span>在未來,精于技術(shù)領(lǐng)域的人應(yīng)該會(huì)有較好的就業(yè)機(jī)會(huì),但隨著機(jī)器人對人類技術(shù)崗位工作的進(jìn)一步取代,需要較高層次人文、藝術(shù)、社交等方面能力的崗位也會(huì)相應(yīng)增加。這應(yīng)該是很長一段時(shí)期內(nèi)人類專有,而人工智能較難復(fù)制的技能。 現(xiàn)在全球性問題(暴力,戰(zhàn)亂、歧視、貧瘠)正在趨向復(fù)雜化,未來的社會(huì)問題或許更嚴(yán)重。任何技術(shù)或者人工智能終究有其局限性,我們生而為人的情感、道德和生存能力在人工智能迅猛發(fā)展的今天和未來,對于分析和解決復(fù)雜的社會(huì)問題,則更為珍貴與必要。 對未來人工智能是否可以“進(jìn)化”出人類的自我意識(shí)和社交技能,社會(huì)各界猜測喜憂參半。面對智力超群卻善惡難辨的人工智能,我們或許更需要的是專注于培養(yǎng)我們?nèi)祟惇?dú)有的特質(zhì):個(gè)性。在無法預(yù)測的未來世界,我們的個(gè)性將決定我們的未來。 人工智能是否能超越人的智能呢?筆者覺得只有當(dāng)機(jī)器人和普通人同時(shí)從零開始接納對一個(gè)技術(shù)或者事物的學(xué)習(xí),然后靠自己的學(xué)習(xí)和經(jīng)驗(yàn)最終戰(zhàn)勝人,而不是通過人類事先輸入的程序。 如果有這一天,人類真的需要警覺。 |
|