西風(fēng) 發(fā)自 凹非寺 量子位 | 公眾號(hào) QbitAI 人工神經(jīng)網(wǎng)絡(luò)(ANN)的學(xué)習(xí)方式,竟然與人腦極為相似! 你沒聽錯(cuò),至少在處理語言這塊上,機(jī)器似乎更像人了。 先看下面這張圖: 藍(lán)色代表的是人的腦電波信號(hào),紅色代表的是人工神經(jīng)網(wǎng)絡(luò)信號(hào)。 而這是人腦和機(jī)器聽同一個(gè)語音時(shí)所作出的反應(yīng)。 是不是非常相似,有木有被驚到? 實(shí)際上這張圖來源于最近的一項(xiàng)研究,相關(guān)論文已被發(fā)表在了Nature子刊Scientific reports上。 而此前,關(guān)于人的大腦以及機(jī)器的大腦是如何進(jìn)行學(xué)習(xí)的問題,始終是一個(gè)謎。 “神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式是否與人類相同”這個(gè)話題,也一直存在爭(zhēng)議。 所以到底有什么證據(jù)可以證明,人類和機(jī)器“很可能是以類似的方式處理語言”? 人工神經(jīng)網(wǎng)絡(luò)信號(hào)與人腦電波信號(hào)非常匹配為了揭開人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的神秘面紗,加州大學(xué)伯克利分校的計(jì)算語言學(xué)家Ga?per Begu?與約翰霍普金斯大學(xué)的博士生Alan Zhou、華盛頓大學(xué)神經(jīng)科學(xué)家Christina Zhao進(jìn)行了這項(xiàng)研究。 在這項(xiàng)研究中,他們給人類聽一種簡(jiǎn)單的聲音,然后收集人類聽到聲音后產(chǎn)生的腦電波。同時(shí),將同一種聲音輸入到神經(jīng)網(wǎng)絡(luò)中,分析神經(jīng)網(wǎng)絡(luò)所產(chǎn)生的信號(hào)。 對(duì)兩者進(jìn)行比較,結(jié)果竟然出奇相似。 最重要的是,研究人員測(cè)試了適用于各種任務(wù)的通用神經(jīng)元組成的網(wǎng)絡(luò),即使是非常通用的網(wǎng)絡(luò)(對(duì)語音或其它聲音沒有偏見),仍然展現(xiàn)出與人類神經(jīng)編碼的對(duì)應(yīng)關(guān)系。 那這項(xiàng)研究具體是怎樣進(jìn)行的呢? 首先,為了更好地對(duì)比人類大腦與人工神經(jīng)網(wǎng)絡(luò)的反應(yīng)情況,研究人員分別找來了14名說英語的人和15名說西班牙語的人。 然后對(duì)這些人播放了一個(gè)單音節(jié)音頻——“bah”,每次播放8分鐘,重復(fù)兩次。 在播放的過程中,研究人員記錄了每個(gè)聽眾腦干中神經(jīng)元平均電活動(dòng)的波動(dòng)情況(腦干是大腦中最先處理聲音的部分)。 另外,研究人員將相同的“bah”聲音輸入到兩組不同的神經(jīng)網(wǎng)絡(luò)中。其中一組神經(jīng)網(wǎng)絡(luò)是經(jīng)過英語訓(xùn)練的,另一組是經(jīng)過西班牙語訓(xùn)練的。 研究人員選擇的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是生成式對(duì)抗網(wǎng)絡(luò)(GAN)。 GAN最早在2014年被提出,用于生成圖像。GAN由兩個(gè)模塊組成,分別是判別器(discriminator)和生成器(generator),它們之間相互博弈學(xué)習(xí),可以產(chǎn)生更好的輸出。 具體來說,生成器創(chuàng)建一個(gè)圖像或聲音的樣本,判別器確定它與訓(xùn)練樣本的接近程度并提供反饋,導(dǎo)致生成器再次反應(yīng),如此循環(huán),直到GAN能夠輸出期望的結(jié)果。 而在這項(xiàng)研究中,判別器最初是在一系列英語或西班牙語的聲音上進(jìn)行訓(xùn)練的。 然后,從未接受過這些聲音訓(xùn)練的生成器必須找到一種產(chǎn)生它們的方法。它開始制造隨機(jī)的聲音,經(jīng)過約40,000次與判別器的交互后,生成器逐漸產(chǎn)生了正確的聲音。經(jīng)過這種訓(xùn)練,判別器也變得更善于區(qū)分真實(shí)聲音以及生成的聲音。 在判別器經(jīng)過訓(xùn)練之后,研究人員就開始播放“bah”的聲音。它們測(cè)量了判別器人工神經(jīng)元的平均活動(dòng)水平的波動(dòng),記錄了神經(jīng)網(wǎng)絡(luò)的處理活動(dòng),重點(diǎn)關(guān)注了網(wǎng)絡(luò)中用于分析聲音的人工神經(jīng)元層(以模擬腦干讀數(shù))。 將采集到的人腦電波信號(hào)與人工神經(jīng)網(wǎng)絡(luò)信號(hào)進(jìn)行比較,結(jié)果見下圖: △使用英語的實(shí)驗(yàn)結(jié)果:藍(lán)色是人腦電波,紅色是人工神經(jīng)網(wǎng)絡(luò)信號(hào) △使用西班牙語的實(shí)驗(yàn)結(jié)果:藍(lán)色是人腦電波,紅色是人工神經(jīng)網(wǎng)絡(luò)信號(hào) 可以發(fā)現(xiàn),這些人工神經(jīng)網(wǎng)絡(luò)信號(hào)與人腦電波信號(hào)非常匹配! 這也就說明了這兩個(gè)系統(tǒng)正在進(jìn)行類似的活動(dòng)。 此外,這項(xiàng)實(shí)驗(yàn)還揭示了人類和機(jī)器之間的另一個(gè)有趣的相似之處。腦電波顯示,說英語和說西班牙語的測(cè)試者對(duì)“bah”聲音有不同的聽覺感知(說西班牙語的人更多地聽到了“pah”的聲音)。 而GAN的信號(hào)也顯示出了:接受英語訓(xùn)練的網(wǎng)絡(luò)在處理聲音時(shí),與接受西班牙語訓(xùn)練的網(wǎng)絡(luò)有些不同。 “而這些差異是朝著同一個(gè)方向產(chǎn)生的,”Begu?解釋道。 說英語的人的腦干對(duì)“bah”聲音的反應(yīng)比說西班牙語的人稍微早一些,而受過英語訓(xùn)練的GAN對(duì)相同的聲音的反應(yīng)也比受過西班牙語訓(xùn)練的模型稍微早一些。 人類與機(jī)器的這種反應(yīng)時(shí)間上的差異幾乎是相同的,大約是千分之一秒。 這也為Begu?提供了額外的證據(jù),即人類和人工網(wǎng)絡(luò)“很可能是以類似的方式處理語言。” 喬姆斯基錯(cuò)了?這項(xiàng)研究的結(jié)論,實(shí)際上與上世紀(jì)50年代語言學(xué)家喬姆斯基(Noam Chomsky)提出的“人類天生就具有理解語言的能力,這種能力與人腦是硬連接(hard-wired)”的觀點(diǎn)相違背。 此外,喬姆斯基還提出了普遍語法(Universal Grammar)概念,即人腦普遍有一種語言習(xí)得機(jī)制,使人們能夠?qū)W會(huì)使用語言。 難道,喬姆斯基的觀點(diǎn)是錯(cuò)誤的? 對(duì)此,有網(wǎng)友表示: ChatGPT已經(jīng)證明了學(xué)習(xí)語言以及理解語言并不需要語法。 也有網(wǎng)友保持懷疑態(tài)度:
Begu?則表示:這場(chǎng)辯論尚未結(jié)束。 △Ga?per Begu? 他表示自己還將進(jìn)一步探索人腦和神經(jīng)網(wǎng)絡(luò)之間的相似之處,例如,他正在測(cè)試大腦皮層發(fā)出的腦電波(在腦干完成其部分聽覺處理后)是否與GAN更深層產(chǎn)生的信號(hào)相對(duì)應(yīng)。 他們希望最終能夠開發(fā)一個(gè)可靠的語言習(xí)得模型(language-acquisition model),用來描述機(jī)器和人類如何學(xué)習(xí)語言,從而進(jìn)行在人類實(shí)驗(yàn)對(duì)象中無法進(jìn)行的實(shí)驗(yàn)。 Begu?研究團(tuán)隊(duì)成員,華盛頓大學(xué)的神經(jīng)科學(xué)家Christina Zhao表示:
此外,Begu?還說正在嘗試看看這條路能夠走多遠(yuǎn),通用神經(jīng)元能夠多接近人類語言。
對(duì)于人腦與人工神經(jīng)網(wǎng)絡(luò)你有什么看法? 傳送門: 參考鏈接: — 完 — |
|