導語 在靜止的車廂里看到相鄰軌道上的列車開動,我們會產(chǎn)生一種錯覺,好像是自己在動。之所以產(chǎn)生錯覺,是因為視覺系統(tǒng)“看到”了運動,但前庭信號卻顯示我們是靜止的。大腦要如何整合這些不同來源的信號,并作出合理推斷? 電生理記錄顯示,大腦神經(jīng)元會編碼前庭運動和視覺運動線索的組合,有些在運動方向一致時響應,有些在運動方向相反時響應。今年8月發(fā)表在 PNAS 上的一項最新研究通過訓練神經(jīng)網(wǎng)絡模型證明,這兩種類型神經(jīng)元之間的權衡決定了視覺線索和前庭線索應該整合還是分離,從而幫助大腦進行因果推斷。 研究領域:因果推斷,多感官整合,人工神經(jīng)網(wǎng)絡 Stephanie Badde, Fangfang Hong, Michael S. Landy | 作者 十三維 | 譯者 梁金 | 審校 鄧一雪 | 編輯 1. 大腦如何進行因果推斷?一只討厭的蚊子持續(xù)煩擾著你,你準備拍打它。你看到它在你的手臂上盤旋,感覺到癢的地方卻在旁邊(圖1A)。這時應該打哪里?數(shù)學上的最優(yōu)解決方案是,對視覺和觸覺指示的位置取平均,并對更可靠、往往誤差更小的信號給予更大加權。大量文獻表明,對于大多數(shù)模態(tài)匹配和知覺任務,人類行為符合這種感官整合的最佳處理邏輯[1-4]。 然而,如果視覺和觸覺所指示的位置非常不同,那么癢感可能是由于另一個原因引起的,如舊蚊蟲的叮咬(圖1B)。在這種情況下,對不同感覺信號做區(qū)隔,比如忽略觸覺,在視覺指示的位置拍打就更有意義。實施這一決定需要進行「因果推斷」(causal inference),即推斷兩個感覺信號是來自一個共同來源還是獨立的來源。人類[5,6]和猴子[7,8]的行為就像在做因果推斷一樣,他們不會整合不太可能來自同一來源的信號。因此一個具有挑戰(zhàn)性的問題是,感覺線索整合和因果推斷是如何在大腦中實現(xiàn)的? 圖1. 多感官整合和因果推斷。(A)當推斷出一個共同原因時,視覺和觸覺的感覺信號被整合;(B)當推斷出單獨的來源時,使用分離的視覺信號。(C)在跨模態(tài)下指向方向一致的神經(jīng)元具有相似的調(diào)諧;(D)異向神經(jīng)元的首選方向在不同模態(tài)下有所不同。這兩種類型的神經(jīng)元對(E)自我運動和(F)世界運動的估計,以及(G)因果推斷判斷都有貢獻,但程度不同。(H)在貝葉斯估計中,整合的和分離的估計被結合起來,其權重等于每種因果情況的概率。 2. 多感官信號怎么整合?今年8月《美國國家科學院院刊》(PNAS)發(fā)表的一篇論文中,Rideaux 等人[9]展示了不同類型的神經(jīng)元之間的相互作用是如何完成最佳整合和因果推斷判斷的。在多感官感知下,他們模擬了一個一直令人困惑但也經(jīng)過了充分研究的案例:視覺和自我運動的前庭信號。這些信號在包括背側內(nèi)顳上腦區(qū)(MSTd)和頂內(nèi)溝腹側區(qū)(VIP)的大腦區(qū)域匯聚。這些區(qū)域的神經(jīng)元通常根據(jù)方向進行調(diào)整,即當感官線索指示某個特定方向時,相應神經(jīng)元激發(fā)次數(shù)最多,信號方向與其首選方向差異越大,激發(fā)則越少。 許多從兩種模態(tài)接收輸入*的神經(jīng)元都是同調(diào)神經(jīng)元(congruent neurons):它們對這兩種模態(tài)有相似的調(diào)諧(圖1C)。因此,同調(diào)神經(jīng)元似乎注定要進行多感官整合(multisensory integration)[10,11]。但奇怪的是,MSTd 和 VIP 中的許多其它神經(jīng)元是異向神經(jīng)元(圖1D),它們對指示相反方向的視覺和前庭信息進行調(diào)諧,例如,視覺刺激發(fā)出的向右運動和前庭的向左運動信號[10,12]。當感覺信號來自不同來源時,異向神經(jīng)元似乎同樣有非常適合的方式進行檢測。如此一來,同調(diào)和異向神經(jīng)元的協(xié)作就可能使大腦進行因果推斷[10,13]。 但直接檢驗這一假設需要同時記錄 MSTd 和 VIP 中的同調(diào)和異向神經(jīng)元,以及它們所投射的神經(jīng)元,這是一項幾乎不可能的任務。不過,人工神經(jīng)網(wǎng)絡的構建可以輕松檢測神經(jīng)元在不同腦域的互聯(lián)行為。
3. 人工神經(jīng)網(wǎng)絡模擬Rideaux等人[9]對這個問題采取了一個特別聰明的方法。他們沒有構建一個由手工調(diào)諧的同調(diào)和異向神經(jīng)元層構成的人工神經(jīng)網(wǎng)絡,而是訓練了一個無約束(unconstrained)的人工神經(jīng)網(wǎng)絡,來執(zhí)行因果推斷判斷及對自我和世界的運動估計,然后檢查了多感官神經(jīng)元的調(diào)諧和連接。這個多層前饋網(wǎng)絡有兩組輸入:視覺和前庭。視覺輸入是自然圖像的短序列,以不同速度向四個方向變換(左-右、上-下、朝向-遠離和視線旋轉(zhuǎn))。前庭輸入來自沿著這四個軸調(diào)整的單位的速度,并略微受到噪聲的干擾。 對于每個運動方向,神經(jīng)網(wǎng)絡輸出的神經(jīng)元分別確定運動速度(訓練為匹配前庭和視覺輸入速度的平均值;圖1E)、世界運動速度(訓練為匹配兩個輸入速度之差;圖1F),并進行共同來源判斷(訓練為匹配兩個輸入速度之差是大是小的二元分類;圖1G)。值得注意的是,對世界運動估計任務的多感官整合與其它領域不同,后者的整合通常與區(qū)隔形成對立,例如僅依賴一種模態(tài)(比較圖1A和B)。因此后續(xù)會帶來一個有趣的問題,即該網(wǎng)絡將如何推廣到對空間、時間或其它特征的多感官知覺的模擬中。 該論文的主要貢獻是,經(jīng)過成功訓練后,該網(wǎng)絡發(fā)展出了與獼猴 MSTd 和 VIP 中同調(diào)和異向相同特征的神經(jīng)元。更具體而言,在網(wǎng)絡的「MSTd」層中,神經(jīng)元對指示方向有清晰的調(diào)諧(方向沿著左-右或前-后軸速度計算),大多數(shù)神經(jīng)元要么具有一致的視覺和前庭調(diào)諧,要么對這兩種模態(tài)表現(xiàn)出相反運動方向的調(diào)諧。這兩種類型的神經(jīng)元都為因果推斷判斷提供了重要的輸入,證實了最初的假設,即同調(diào)和異向神經(jīng)元之間的權衡對于推斷兩個信號是否來自同一來源至關重要。 至于該網(wǎng)絡的運動速度感知,同調(diào)細胞為自我運動估計提供了更強的輸入,異向細胞則為世界運動估計提供了更強的輸入。這兩種類型的神經(jīng)元也都能對另一種知覺估計做出貢獻,只不過程度較小。先前帶有手工調(diào)諧的同調(diào)和異向神經(jīng)元的計算模型已經(jīng)證明,這種網(wǎng)絡能夠執(zhí)行因果推斷[13,14],不過,沒這些特性的人工神經(jīng)網(wǎng)絡亦如此[15]。與這些自上而下的方法相反,Rideaux等人[9]表明,同時進行知覺和因果推斷判斷的要求促使了同調(diào)和異向神經(jīng)元的發(fā)展,表明這種神經(jīng)基質(zhì)(neural substrate)是計算的最佳方案。 圖2. 人工神經(jīng)網(wǎng)絡中的視覺和前庭信號輸入,在經(jīng)MSTd層三種不同方式解碼后,分別輸出對自我、場景和因果推斷的估計 該網(wǎng)絡在感知任務中的表現(xiàn)實質(zhì)上反映了人類和猴子在方向辨別任務中的行為[11]。成功訓練后,該網(wǎng)絡具有較小的視覺和前庭運動輸入的跨模態(tài)差異。這些測試中的視覺刺激被更改為一組移動點集,其可靠性通過改變向同一方向移動的點的比例來操縱。網(wǎng)絡則根據(jù)其可靠性整合視覺和前庭輸入:如果視覺輸入可靠性較低,自我運動估計與前庭輸入更一致;如果視覺輸入可靠性較高,自我運動估計則與視覺輸入更一致。值得注意的是,在訓練期間,自我運動估計得到了加強,以匹配50-50的平均視覺和前庭信號,這就提出了一個問題,即執(zhí)行可靠性加權整合的能力是來自對幾項任務的聯(lián)合訓練,還是由于網(wǎng)絡架構。 當網(wǎng)絡推斷出單獨的原因時,視覺輸入對自我運動估計的影響要比推斷出兩個信號的共同來源時低。如果一種模態(tài)輸入是有噪聲的,即相同的刺激導致不同試驗的內(nèi)部測量略有不同,這種跨模態(tài)偏向的差異會自動出現(xiàn)[6]。然而以目前的形式,該網(wǎng)絡還無法重現(xiàn)因果推斷的以下行為特征:當信號更不一致,即不太可能從同一來源出現(xiàn)時,跨模態(tài)的偏差為何會減少。 鑒于該模型是嚴格的前饋,因果推斷及自我和世界的運動估計有單獨的輸出,該模型根本不能讓因果推斷判斷影響自我運動的估計。換句話說,模型無法忽視我們介紹性示例中舊蚊子叮咬的撓癢感。相比之下,貝葉斯因果推斷模型[6]則復制了跨模態(tài)偏差對兩個信號之間差異的非線性依賴性[6,16]。他們通過將整合和分離的估計值相加來實現(xiàn)這一目標,并分別以共同和單獨來源的推斷概率加權(圖1H)。在這種觀點下,Rideaux等人[9]的神經(jīng)網(wǎng)絡模型包含了知覺兩階段過程的第一階段。 事實上,多感官背景下的人類大腦活動,對整合的、分離的、及最終合并的估計在獨立表征上是一致的[17,18]。貝葉斯因果推斷方法的另一個關鍵組成部分是假設的共同來源的先驗概率。在 Rideaux 等人的模型[9]中,這種先驗可能反映在多感官 MSTd 層和輸出層之間的連接權重中。然而,這種先驗共因隨著實驗環(huán)境的變化而變化[19,20],表明還需要對因果推斷過程進行額外的輸入。因此,一個更完整的多感官整合和因果推斷模型,還將需要為同源和分離源的知覺及靈活的先驗共源估計提供表征空間。 總之,Rideaux等人[9]為因果推斷中同調(diào)和異向神經(jīng)元的作用這一難題提供了令人信服的解決方案。他們通過訓練一個人工神經(jīng)網(wǎng)絡,借由促使同調(diào)和反向神經(jīng)元同時發(fā)展,得出了對自我和世界的運動估計及相應的因果推斷判斷。不過大腦是否以這種簡單的前饋方式實現(xiàn)這推斷,以及因果推斷是如何參與知覺判斷的,依然是未來重要的問題。此外在個體發(fā)育過程中,是否需要感覺體驗來發(fā)展異向神經(jīng)元,或者這種人工神經(jīng)網(wǎng)絡訓練所援引的過程是否在進化過程中發(fā)揮了作用,將同樣是令人非常著迷的探索方向。 |
|