騰訊數(shù)碼訊(肖恩)近幾個(gè)月來(lái),微軟,谷歌,蘋(píng)果,F(xiàn)acebook和其他技術(shù)公司紛紛宣布我們不再生活在移動(dòng)優(yōu)先的世界。相反,這個(gè)世界已經(jīng)變成了人工智能優(yōu)先。虛擬助手和其他服務(wù)將成為你的主要信息來(lái)源,幫助你完成日常任務(wù)。你的智能手機(jī)或個(gè)人電腦現(xiàn)在要退居次席了。 支持這個(gè)新方向的是你可能經(jīng)常聽(tīng)到的兩個(gè)術(shù)語(yǔ):機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。它們是“教”人工智能來(lái)執(zhí)行任務(wù)的兩種方法,但用途可遠(yuǎn)遠(yuǎn)不止創(chuàng)建智能助手那么簡(jiǎn)單。那么機(jī)器學(xué)習(xí)和深度學(xué)習(xí)究竟有何不同?本文將對(duì)此進(jìn)行一番探究。 電腦現(xiàn)在有了視覺(jué)、聽(tīng)覺(jué)和講話的能力 在機(jī)器學(xué)習(xí)的幫助下,計(jì)算機(jī)現(xiàn)在可以通過(guò)“訓(xùn)練”來(lái)預(yù)測(cè)天氣,確定股票市場(chǎng)的結(jié)果,了解購(gòu)物習(xí)慣,控制工廠中的機(jī)器人等眾多功能。谷歌,亞馬遜,F(xiàn)acebook,Netflix,LinkedIn以及更多面向消費(fèi)者的熱門(mén)服務(wù)都得到機(jī)器學(xué)習(xí)的支持。而所有這些學(xué)習(xí)的核心就是所謂的算法。 簡(jiǎn)而言之,算法不是一個(gè)完整的計(jì)算機(jī)程序(一組指令),而是解決單個(gè)問(wèn)題的有限步驟。舉個(gè)例子,搜索引擎會(huì)依靠一種算法來(lái)抓取你輸入到搜索字段框中的文本,并搜索連接的數(shù)據(jù)庫(kù)以提供相關(guān)的搜索結(jié)果。它需要采取具體步驟來(lái)實(shí)現(xiàn)單一、具體的目標(biāo)。 其實(shí)早在1965年之后,機(jī)器學(xué)習(xí)就已經(jīng)出現(xiàn)了。Arthur Samuel當(dāng)時(shí)不想編寫(xiě)一個(gè)非常詳細(xì),冗長(zhǎng)的程序,讓計(jì)算機(jī)在西洋跳棋中打敗自己。相反,他創(chuàng)造了一種算法,使計(jì)算機(jī)能夠自我對(duì)抗數(shù)千次,并從中“學(xué)習(xí)”如何成為一位獨(dú)立的對(duì)手。等到1962年,這臺(tái)電腦擊敗了康涅狄格州的跳棋冠軍。 因此,機(jī)器學(xué)習(xí)的核心是試驗(yàn)和錯(cuò)誤。我們不能手動(dòng)編寫(xiě)程序來(lái)幫助自動(dòng)駕駛汽車區(qū)分行人與樹(shù)木或車輛,但我們可以為程序創(chuàng)建一套使用數(shù)據(jù)來(lái)解決問(wèn)題的算法。算法還可以用來(lái)幫助程序預(yù)測(cè)颶風(fēng)的路徑,對(duì)阿爾茨海默氏癥進(jìn)行早期診斷,確定世界上薪水最虛高和最過(guò)低的足球明星等等。 機(jī)器學(xué)習(xí)通常是在低端設(shè)備上運(yùn)行的,它會(huì)將問(wèn)題分解成多個(gè)部分。每個(gè)部分會(huì)按順序被解決,然后組合在一起以創(chuàng)建單個(gè)問(wèn)題答案??▋?nèi)基梅隆大學(xué)著名的機(jī)器學(xué)習(xí)貢獻(xiàn)者Tom Mitchell解釋說(shuō),如果計(jì)算機(jī)程序的特定任務(wù)的性能得到提高,那么計(jì)算機(jī)程序?qū)⒖梢詮倪@些經(jīng)驗(yàn)中得到“學(xué)習(xí)”。機(jī)器學(xué)習(xí)算法本質(zhì)上是使程序能夠進(jìn)行預(yù)測(cè),并且隨著時(shí)間的推移,根據(jù)試驗(yàn)和錯(cuò)誤經(jīng)驗(yàn)提高預(yù)測(cè)的準(zhǔn)確率。 以下是機(jī)器學(xué)習(xí)的四種主要類型: 監(jiān)督機(jī)器學(xué)習(xí) 在這種情況下,你需要向計(jì)算機(jī)程序提供帶有標(biāo)簽的數(shù)據(jù)。舉個(gè)例子,如果分配的任務(wù)是使用分類圖像算法區(qū)分男孩和女孩的圖片,那么男孩的照片會(huì)被打上“男孩”標(biāo)簽,女孩的照片會(huì)被打上“女孩”標(biāo)簽。這被認(rèn)為是一種“訓(xùn)練”數(shù)據(jù)集,在程序能夠以可接受的速率成功地對(duì)圖像進(jìn)行分類之前,這些標(biāo)簽會(huì)一直被保留。 半監(jiān)督機(jī)器學(xué)習(xí) 在這種情況下,只有少數(shù)圖像被標(biāo)記。計(jì)算機(jī)程序隨后將使用算法對(duì)未標(biāo)記的圖像進(jìn)行最佳猜測(cè),然后將數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)反饋給程序。隨后,它會(huì)被提供一批新的圖像,當(dāng)中只有少數(shù)分類標(biāo)簽。這是一個(gè)重復(fù)的過(guò)程,直到程序能以可接受的速度區(qū)分男孩和女孩。 無(wú)監(jiān)督機(jī)器學(xué)習(xí) 這種類型的機(jī)器學(xué)習(xí)不涉及任何標(biāo)簽。相反,程序會(huì)被要求使用兩種方法之一將男孩和女孩的圖像分成兩組。當(dāng)中的一種算法被稱為“聚類”,它會(huì)根據(jù)諸如頭發(fā)長(zhǎng)度,下巴大小,眼睛位置等特征將相似的對(duì)象分組在一起。另一種算法稱為“關(guān)聯(lián)”,程序會(huì)根據(jù)它發(fā)現(xiàn)的相似性創(chuàng)建if / then規(guī)則。換句話說(shuō),它會(huì)對(duì)圖像之間的共同模式作出判斷,并對(duì)它們進(jìn)行相應(yīng)的排序。 增強(qiáng)機(jī)器學(xué)習(xí) 國(guó)際象棋是這種算法一個(gè)很好的例子。該程序知道游戲的規(guī)則和玩法,并會(huì)按部就班地完成一輪對(duì)弈。提供給該計(jì)劃的唯一信息是它是否贏得比賽。它會(huì)一直重播比賽,追蹤自己成功的落子,直到最終贏得比賽。 深度學(xué)習(xí) 深度學(xué)習(xí)基本上是“更深層次”的機(jī)器學(xué)習(xí)。它的靈感來(lái)源于人類大腦的工作方式,但需要能夠處理數(shù)字和巨量大數(shù)據(jù)的獨(dú)立顯卡的高端計(jì)算機(jī)才能工作。 相比會(huì)把問(wèn)題分解成多個(gè)部分并逐個(gè)解決的標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)會(huì)以端到端的方式來(lái)解決問(wèn)題。更棒的是,提供深度學(xué)習(xí)算法的數(shù)據(jù)和時(shí)間越多,解決任務(wù)的效果越好。 在我們的機(jī)器學(xué)習(xí)示例中,我們使用了由男孩和女孩組成的圖像。該程序會(huì)使用算法來(lái)對(duì)這些圖像進(jìn)行分類,主要基于填鴨式的數(shù)據(jù)。但如果是深度學(xué)習(xí),數(shù)據(jù)不提供給程序使用。相反,它會(huì)掃描圖像中的所有像素,以發(fā)現(xiàn)可用于區(qū)分男孩和女孩的邊緣。之后,它會(huì)將邊緣和形狀置于可能重要的排序中以確定這兩種性別。 用更簡(jiǎn)單的話來(lái)說(shuō),機(jī)器學(xué)習(xí)將根據(jù)人類提供的信息來(lái)區(qū)分正方形和三角形:正方形有四個(gè)點(diǎn),三角形有三個(gè)。通過(guò)深度學(xué)習(xí),該程序不會(huì)把填鴨式信息作為起點(diǎn)。相反,它使用算法來(lái)確定形狀有多少條線,這些線是否連通,以及它們是否垂直。當(dāng)然,算法最終會(huì)發(fā)現(xiàn)插入的圓不適合其正方形和三角形排序。 同樣,后者的“深度思考”過(guò)程需要更多的硬件來(lái)處理算法生成的大數(shù)據(jù)。這些機(jī)器傾向于駐留在大型數(shù)據(jù)中心中,以創(chuàng)建人工神經(jīng)網(wǎng)絡(luò)來(lái)處理生成的所有大數(shù)據(jù),并將其提供給人工智能應(yīng)用程序。使用深度學(xué)習(xí)算法的程序也需要更長(zhǎng)時(shí)間的訓(xùn)練,因?yàn)樗麄冃枰跊](méi)有人為輔助的情況下獨(dú)立學(xué)習(xí)。 翻譯是深度學(xué)習(xí)一個(gè)不錯(cuò)的應(yīng)用案例。這項(xiàng)技術(shù)能夠聆聽(tīng)主持人以英語(yǔ)進(jìn)行的交談,并通過(guò)文字和電子語(yǔ)音實(shí)時(shí)將他的話翻譯成不同的語(yǔ)言。由于整體語(yǔ)言,語(yǔ)言使用,語(yǔ)音音調(diào)以及硬件成熟能力的不同,這方面的發(fā)展多年以來(lái)都比較緩慢。 深度學(xué)習(xí)還能用來(lái)驅(qū)動(dòng)聊天機(jī)器人,比如亞馬遜Alexa,微軟Cortana,F(xiàn)acebook和Instagram等。在社交媒體上,基于深度學(xué)習(xí)的算法可以用來(lái)提供聯(lián)系方式和頁(yè)面建議。即使你沒(méi)有訪問(wèn)它們的網(wǎng)站,深度學(xué)習(xí)也可以幫助這些公司根據(jù)你的口味進(jìn)行個(gè)性化廣告定制。 “展望未來(lái),下一個(gè)大趨勢(shì)將是”設(shè)備“的概念逐漸消失,”谷歌首席執(zhí)行官Sundar Pichai表示,“隨著時(shí)間的推移,計(jì)算機(jī)本身 ——無(wú)論它是何形式——將會(huì)成為一位智能助手,幫助你度過(guò)每一天。我們將從移動(dòng)優(yōu)先轉(zhuǎn)移到到人工智能優(yōu)先的世界?!?/p> |
|