來源:《中國計算機學會通訊》2016年第4期《專欄》 作者:劉 鋒 2015年以來,“人工智能”成為科技界和產(chǎn)業(yè)界最熱門的詞語。智能冰箱、智能空調(diào)、智能手表和智能機器人,還有谷歌、百度各自的人工智能大腦等新產(chǎn)品不斷涌現(xiàn)。但與此同時,人工智能威脅論也甚囂塵上。我們能否通過研究人工智能產(chǎn)品和系統(tǒng)的智商發(fā)展水平并與人類智商進行對比,從而為解決人工智能威脅論問題尋找定量的分析方法呢? 人工智能定量評測目前面臨兩個重要挑戰(zhàn):第一,人工智能系統(tǒng)目前沒有形成統(tǒng)一的模型;第二,人工智能系統(tǒng)與以人類為代表的生命體之間目前沒有形成統(tǒng)一的模型。 這兩個挑戰(zhàn)都指向了同一個問題,即對于所有的人工智能系統(tǒng)和所有生命體(特別是以人類為代表的生命體)需要有一個統(tǒng)一的模型進行描述,只有這樣才能在這個模型上建立智力測量方法并進行測試,從而形成統(tǒng)一的、可進行相互比較的智力發(fā)展水平評價結(jié)果。 標準智能模型和人工智能智商測試 從2014年開始,我和中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心教授石勇針對如何定量分析人工智能與人類智慧的關(guān)系進行了研究,研究參考了馮·諾伊曼結(jié)構(gòu)、戴維·韋克斯勒人類智力模型、知識管理領域DIKW(Data, Information, Knowledge, Wisdom,數(shù)據(jù)、信息、知識、智慧)模型體系等。我們分別在2014年和2015年發(fā)表論文提出建立“標準智能模型”,統(tǒng)一描述人工智能系統(tǒng)和人類的特征和屬性。 其中,馮·諾伊曼結(jié)構(gòu)給我們的啟發(fā)是:標準智能系統(tǒng)模型應包含輸入/輸出系統(tǒng),能夠從外界獲取信息,能夠?qū)?nèi)部產(chǎn)生的結(jié)果反饋給外部世界。只有這樣,標準智能系統(tǒng)才能成為“活”的系統(tǒng)。 戴維·韋克斯勒關(guān)于人類智能的定義給我們的啟發(fā)是:智力能力由多個要素組成,而非圖靈測試或視覺圖靈測試那樣只關(guān)注智力能力的一個方面。 DIKW模型體系給我們的啟發(fā)是:智慧是一種解決問題、積累知識的能力;而知識是人類不斷與外界交互后沉淀下來結(jié)構(gòu)化的數(shù)據(jù)和信息。一個智能系統(tǒng)不僅僅要掌握知識,更重要的是還要有解決問題的創(chuàng)新能力。這種對知識的掌握能力、解決問題的創(chuàng)新能力與戴維·韋克斯勒理論、馮·諾伊曼架構(gòu)相結(jié)合,就可以形成智能系統(tǒng)智力能力的多層次結(jié)構(gòu)“標準智能模型”,如圖1所示。 根據(jù)上述研究,可提出標準智能系統(tǒng)的判定標準:任何系統(tǒng)(包括人工智能系統(tǒng)、人類等生命系統(tǒng)),如果符合如下特征,就可以認為這個系統(tǒng)屬于標準智能系統(tǒng)。 ● 特征1:能通過聲音、圖像、文字等方式(包括但不限于這三種方式)從外界獲取數(shù)據(jù)、信息和知識的能力。 ● 特征2:能夠?qū)耐饨绔@取的數(shù)據(jù)、信息和知識轉(zhuǎn)化為系統(tǒng)掌握的知識。 ● 特征3:能根據(jù)外界數(shù)據(jù)、信息和知識所產(chǎn)生的需求,通過運用所掌握的知識進行創(chuàng)新的能力。這些能力包括但不限于聯(lián)想、創(chuàng)作、猜測、發(fā)現(xiàn)規(guī)律等,這種能力運用的結(jié)果可以形成自身掌握的新知識。 ● 特征4:能夠通過聲音、圖像、文字等方式(包括但不僅限于這三種方式)將系統(tǒng)產(chǎn)生的數(shù)據(jù)、信息和知識反饋給外界或?qū)ν饨邕M行改造。 2014年,我們在標準智能模型的基礎上構(gòu)建了人工智能智商評測量表。從信息或知識的輸入、輸出、掌握和創(chuàng)新等四大方面建立人工智能智商評價體系,并在此基礎上建立圖像、文字、聲音識別、常識、計算、翻譯、創(chuàng)作、挑選、猜測、發(fā)現(xiàn)等十五個小類,形成人工智能智商評測量表。我們對世界50個搜索引擎和3類不同年齡段人群進行了“人工智能智商測試”,測試結(jié)果發(fā)現(xiàn)目前人工智能系統(tǒng)的智商遠遠低于人類智商,評測最高的谷歌系統(tǒng)尚不及6歲兒童智商的一半,見表1。 2016年2月,我們和中國科學院大學劉穎團隊開展“2016年人工智能智商測試”,目前已對谷歌、百度、搜狗等人工智能系統(tǒng)以及蘋果Siri、微軟小冰等進行了測試,工作還在進行中。不過從已完成的工作看,谷歌、百度等人工智能系統(tǒng)的性能比兩年前已有大幅提高,但仍與6歲兒童有較大差距。 擴展的馮·諾伊曼架構(gòu) 標準智能模型的建立參考了馮·諾伊曼架構(gòu)。馮·諾伊曼架構(gòu)由計算器、邏輯控制裝置、存儲器、輸入系統(tǒng)和輸出系統(tǒng)五個部分構(gòu)成。通過對比圖1和圖2的差別能夠發(fā)現(xiàn),馮·諾伊曼架構(gòu)可以補充兩個部分。通過這種補充,我們得以將人、機器以及人工智能系統(tǒng)用一個更為明晰的方式表示出來。 第一個補充是創(chuàng)新創(chuàng)造功能,即能夠根據(jù)已有的知識,發(fā)現(xiàn)新的知識元素和新的規(guī)律,使之進入到存儲器,供計算機和控制器使用,并通過輸入/輸出系統(tǒng)與外部進行知識交互。第二個補充是能夠進行知識共享的外部知識庫或云存儲器,而馮·諾伊曼架構(gòu)的外部存儲只為單一系統(tǒng)服務。因此,對馮·諾伊曼架構(gòu)進行擴展,可形成新的架構(gòu)(見圖3)。 人工智能系統(tǒng)智能等級分級標準 在研究的過程中還發(fā)現(xiàn),無論在自然界還是人類社會,即使是智商相同的人工智能系統(tǒng),因其所在關(guān)鍵領域仍然存在巨大差異,也都存在智能和知識的分級現(xiàn)象。譬如,螞蟻、魚、猴子和人類,雖然都屬于生命系統(tǒng),但其種群個體都存在智能的差異。人類的教育體系也存在分級,例如本科、碩士、博士的分級。等級內(nèi)部進行考核區(qū)分優(yōu)劣,但在不同等級間,需要在知識、能力、資歷上有明顯提升和考核才能升級。 回到人工智能系統(tǒng)的智商測試上,應如何區(qū)分智能系統(tǒng)因在關(guān)鍵領域功能不同而產(chǎn)生的巨大差異呢?上述研究中提到的“標準智能模型”(擴展的馮·諾伊曼架構(gòu))給了我們啟發(fā),判斷標準如下: ● 能不能和測試者(人類)進行信息交互,也就是有沒有輸入/輸出系統(tǒng); ● 系統(tǒng)內(nèi)部有沒有能夠存儲信息和知識的知識庫; ● 這個系統(tǒng)的知識庫能不能不斷更新和增長; ● 這個系統(tǒng)的知識庫能不能與其他人工智能系統(tǒng)進行知識共享; ● 這個系統(tǒng)除了從外部學習并更新自己的知識庫之外,能不能主動產(chǎn)生出新的知識并分享給其他人工智能系統(tǒng)。 人工智能系統(tǒng)的6個智能等級分級 對于人工智能系統(tǒng)的第0級系統(tǒng),其基本特征在理論上存在,但現(xiàn)實中并不存在這樣的人工智能系統(tǒng)。在擴展的馮·諾伊曼架構(gòu)延伸出來的分級規(guī)則中,可以做一些組合,例如可以信息輸入,但不能信息輸出;或者可以信息輸出,但不能信息輸入;或者可以創(chuàng)新創(chuàng)造,但知識庫不能增長。對于這些在現(xiàn)實中不能或無法找到對應系統(tǒng)范例的案例,我們將其統(tǒng)一劃歸到“人工智能系統(tǒng)的第0級系統(tǒng)”,也可以叫“人工智能系統(tǒng)的特異類系統(tǒng)”。 對于人工智能系統(tǒng)的第1級系統(tǒng),其基本特征是無法與人類測試者進行信息交互。例如有一種被稱為泛靈論的思想認為天下萬物皆有靈魂或自然精神,一棵樹和一塊石頭都和人類一樣,具有同樣的價值與權(quán)利。當然,這種觀點從科學的角度看,只能算作猜想或哲學思考。從“能不能和測試者(人類)進行信息交互”的分級規(guī)則看,因為石頭等物體不能與人類進行信息交互,也許它內(nèi)部有知識庫,能夠創(chuàng)新知識,或者能夠與其他石頭進行信息交互,但對人類測試者來說則是黑箱,不能讓人了解。因此不能與測試者(人類)進行信息交互的物體和系統(tǒng)可以定義為“人工智能系統(tǒng)的第1級系統(tǒng)”,符合第1級分類的范例有石頭、木棍、鐵塊以及水滴等等不能與人類進行信息交互的物體或系統(tǒng)。 對于人工智能系統(tǒng)的第2級系統(tǒng),其基本特征是能夠與人類測試者進行交互,存在控制器和存儲器,即馮·諾伊曼架構(gòu)描述的系統(tǒng),因此很多家用電器被稱作智能家電,如智能冰箱、智能電視、智能微波爐和智能掃地機。這些系統(tǒng)大多有一個特點,即雖然它們內(nèi)部或多或少有控制程序信息,但一旦出廠,就無法再更新它們的控制程序,不能進行升級,更不會自動地學習或產(chǎn)生新的知識。譬如智能洗衣機,人們按什么鍵,洗衣機就啟動什么功能。從購買到損壞,其功能都不會發(fā)生變化(故障除外)。這種系統(tǒng)能夠與人類測試者和使用者進行信息交互,符合馮·諾伊曼架構(gòu)描述的特征,而且它的控制程序或知識庫從誕生時起就不再發(fā)生變化,這種系統(tǒng)可以定義為“人工智能系統(tǒng)的第2級系統(tǒng)”,范例包括日常見到的掃地機器人、老式的家用電冰箱、空調(diào)、洗衣機等等。 對于人工智能系統(tǒng)的第3級系統(tǒng),其基本特征是除具備2級系統(tǒng)的特征外,其控制器、存儲器中包含的程序或數(shù)據(jù)可不聯(lián)網(wǎng)進行升級或增加。例如家用電腦和手機是我們常用的智能設備,它們的操作系統(tǒng)往往可以定期升級。例如,電腦的操作系統(tǒng)可從Windows1.0升級到Windows10.0,手機的操作系統(tǒng)可從Android1.0升級到Android5.0,這些設備的內(nèi)部應用程序也可以根據(jù)不同的需要不斷更新升級。這樣,家用電腦、手機等設備的功能會變得越來越強大,可以應對的場景也越來越多。除了家用電腦,很多家用電器、機器人也都開始留有接口,可以通過外接設備進行系統(tǒng)升級。這一類系統(tǒng)明顯比第2級智能系統(tǒng)適應性更強。這種系統(tǒng)能夠與人類測試者、使用者進行信息交互,但不能與其他系統(tǒng)通過“云端”進行信息交互,其控制程序或知識庫只能接受USB、光盤等外接設備進行程序或信息升級的系統(tǒng),可以定義為“人工智能系統(tǒng)的第3級系統(tǒng)”,范例包括智能手機、家用電腦、單機版的辦公軟件等。 對于人工智能系統(tǒng)的第4級系統(tǒng),其基本特征除了包含3級系統(tǒng)的特征外,最重要的是可以通過網(wǎng)絡與其他智能系統(tǒng)共享信息和知識。2011年歐盟資助了一個叫作RoboEarth的項目,該項目旨在讓機器人可以通過互聯(lián)網(wǎng)分享知識。幫助機器人相互學習、共享知識,不僅能夠降低成本,還會幫助機器人提高自學能力、適應能力,推動其更快、更大規(guī)模地普及。云機器人的這些能力提高了其對復雜環(huán)境的適應性。這類系統(tǒng)除了具備3級系統(tǒng)的功能,還多了一個重要的功能,即信息可以通過云端進行共享,因此這種系統(tǒng)能夠與人類測試者、使用者進行信息交互,可以通過“云端”進行信息交互,進行程序或信息升級。但這類系統(tǒng)所有的信息都是直接從外部獲得,其內(nèi)部無法自主地、創(chuàng)新創(chuàng)造性地產(chǎn)生新的知識。這種系統(tǒng)可以定義為“人工智能系統(tǒng)的第4級系統(tǒng)”,范例包括谷歌大腦、百度大腦、RoboEarth云機器人、B/S(Browser/Server,瀏覽器/服務器)架構(gòu)的網(wǎng)站等。 對于人工智能系統(tǒng)的第5級系統(tǒng),最基本的特征就是能夠創(chuàng)新創(chuàng)造,識別和鑒定創(chuàng)新創(chuàng)造對人類的價值,以及將創(chuàng)新創(chuàng)造產(chǎn)生的成果應用在人類的發(fā)展過程中。我們在擴展的馮·諾伊曼架構(gòu)時,對原來的馮·諾伊曼架構(gòu)增加了創(chuàng)新知識模塊,就是試圖把人納入到擴展的人工智能系統(tǒng)概念中,人類可以看作是大自然構(gòu)建的特殊“人工智能系統(tǒng)”。與前四個等級不同,人類等生命體最大的特征就是可以不斷地創(chuàng)新創(chuàng)造,如發(fā)現(xiàn)萬有引力、元素周期表,撰寫出新小說,創(chuàng)造新的音樂、畫作等等,然后通過文章、信件、電報,甚至互聯(lián)網(wǎng)進行傳播和分享。不斷地進行創(chuàng)新創(chuàng)造,并能夠識別創(chuàng)新創(chuàng)造對自身的用處,這讓人類占據(jù)了地球生態(tài)環(huán)境下的智力制高點。因此,這種系統(tǒng)能夠與人類測試者使用者進行信息交互,可以創(chuàng)新創(chuàng)造出新的知識,并可以通過文章、信件、電報甚至互聯(lián)網(wǎng)這樣的“云端”進行信息交互,這種系統(tǒng)可以定義為“人工智能系統(tǒng)的第5級系統(tǒng)”。人類是第5級人工智能系統(tǒng)最突出的范例。 谷歌AlphaGo屬于智能的第幾等級 2016年3月,谷歌AlphaGo(阿爾法狗)與韓國圍棋世界冠軍李世石進行了舉世矚目的圍棋比賽,并以大比分獲得勝利。那么AlphaGo屬于人工智能系統(tǒng)的第幾級?我們可以根據(jù)上述規(guī)則進行評定。 因為AlphaGo可以與棋手進行比賽,具有龐大的運算系統(tǒng)和數(shù)據(jù)存儲系統(tǒng),因此具備第2級系統(tǒng)的條件。在谷歌的研發(fā)過程中,AlphaGo的策略訓練模型版本通過不斷進行大量數(shù)據(jù)訓練而不斷升級,從2016年1月與歐洲冠軍對戰(zhàn),到2016年3月與韓國圍棋世界冠軍李世石比賽,AlphaGo的軟硬件系統(tǒng)也獲得很大提升,因此AlphaGo具備了第3級系統(tǒng)的條件。 從公開的資料看,AlphaGo雖然可以通過網(wǎng)絡實現(xiàn)大量CPU和GPU協(xié)同工作,但由于保密性或階段性問題,谷歌目前還沒有在互聯(lián)網(wǎng)上開放AlphaGo程序接受用戶的在線挑戰(zhàn),因此AlphaGo不具備第4級智能系統(tǒng)條件。 關(guān)于AlphaGo是否具備創(chuàng)新創(chuàng)造性問題,我們認為它依然是依托人工支持的大數(shù)據(jù)訓練形成的策略模型,同時在比賽中結(jié)合比賽對手的落點數(shù)據(jù),根據(jù)其內(nèi)部的運算規(guī)則,來不斷形成自己的落點數(shù)據(jù),這些落點數(shù)據(jù)最終形成比賽數(shù)據(jù)集合。AlphaGo根據(jù)圍棋規(guī)則與對手的比賽數(shù)據(jù)集合進行計算和比較,判斷輸贏,整個過程完全在人類設定的規(guī)則下運行,無法體現(xiàn)其自身的創(chuàng)造性,如圖4所示。 即使AlphaGo形成的落點數(shù)據(jù)集合很可能是人類歷史上沒有出現(xiàn)過的,也不能說明AlphaGo具備了獨立的創(chuàng)新創(chuàng)造功能。例如,我們用計算機程序?qū)崿F(xiàn)下述過程:從1萬到100萬的自然數(shù)中隨機選取兩個數(shù)進行相乘,記錄相乘結(jié)果,重復此過程361次,即使得出的自然數(shù)集合很大,并且可能是人類歷史上沒有出現(xiàn)過的,我們也不能認定該計算機程序具有創(chuàng)新創(chuàng)造性。 如果AlphaGo在沒有人類提供數(shù)據(jù)的情況下,能夠主動獲取棋譜,自動設計程序進行模擬對戰(zhàn),學習經(jīng)驗,并用于改變自己的訓練模型,用于實戰(zhàn)比賽,戰(zhàn)勝對手,那么在這種情況下,我們才可能認為AlphaGo具備創(chuàng)新性。但從人工智能的發(fā)展過程看,AlphaGo還完全無法實現(xiàn)這一點。因此,綜合來看,AlphaGo的智能等級被評定為3級,與人類相差兩個級別。 工作意義和后續(xù)工作 對人工智能系統(tǒng)進行智力分級,有助于我們更好地對這些智能系統(tǒng)進行分類和評判,同時為低等級智能系統(tǒng)的發(fā)展方向提供支持。對于人工智能系統(tǒng)的分級問題,我們與石勇教授等人正在建立數(shù)學模型,希望用定量的方式判斷人工智能系統(tǒng)所屬的分類等級。這項工作在公布之后,我們也將撰文向大家匯報。 作者: 劉鋒 中科圖靈世紀CEO,人工智能學家主編,北京交通大學計算機博士。主要研究方向為人工智能智能等級和智商研究、互聯(lián)網(wǎng)與腦科學交叉對比研究等。 |
|