● 世界那么大,聲音那么多,我們的大腦究竟是如何分辨出每個人不同的聲音特質(zhì),每種樂器不同的音色? ● 當你接到一個電話,即使環(huán)境嘈雜、信號不好,你仍可以不費吹灰之力聽出電話那頭是熟人還是陌生人。每天,我們大腦接收來自外界的信息紛繁復雜,只有大腦對外來刺激進行分類后,我們才有了感知判斷。那么大腦是如何開展這項工作的呢? 7月8日,《神經(jīng)元》期刊在線發(fā)表了題為《小鼠聽皮層神經(jīng)元群體結構動態(tài)變化實現(xiàn)感覺到范疇的轉(zhuǎn)化》的研究論文,該研究由張江上海腦科學與類腦研究中心、中國科學院腦科學與智能技術卓越創(chuàng)新中心(神經(jīng)科學研究所)的相關研究員完成。 張江科學家由此發(fā)現(xiàn)了大腦聽覺皮層分辨高低音范疇中的些許奧妙:在經(jīng)過訓練之后,小鼠能夠準確將不同頻率的單音分類為高頻音和低頻音。而且在聽到臨近分界線的音頻信號時,小鼠們會動用大量腦細胞去提高分辨力。更有趣的是,只有當它們在執(zhí)行分類任務時,大腦內(nèi)的這些神經(jīng)元才會被激活。 徐寧龍研究員和論文第一作者博士研究生辛宇在安裝小鼠行為訓練裝置 這是由于我們大腦接收到的感覺信息種類繁雜,而我們能夠形成的概念和采取的行動則數(shù)目有限,為了形成有意義的認知來指導行為,我們的大腦需要對這些信息進行高效的組織管理,而其中最基本的過程就是范疇化(categorization)。簡單來講,就是對外來刺激進行分類與定位,從而可以從外部信息中高效抽取最相關的信息,形成感知判斷。 例如,當接收到豐富多樣的語音信息,我們的大腦會把語音歸類到屬于不同熟悉程度的人,或陌生人。 還有個例子是我們對色彩的認知。當看到彩虹時,盡管其中可見光的波長是連續(xù)變化的,然而我們對于波長的物理數(shù)值難以形成感性認知或顏色概念,因此我們需要將連續(xù)的波長信息范疇化,將其定義為離散的七種顏色類別,即紅橙黃綠青藍紫,便于信息存儲與交流。這說明感覺信息范疇化可以幫助大腦高效存儲信息,形成認知。 世界各國的科學家們已經(jīng)在不同物種的各種腦區(qū)觀察到與刺激類別相關的神經(jīng)活動。然而,以往的研究側重的是神經(jīng)運算的結果,對于感覺信息怎樣被轉(zhuǎn)化為離散的類別信息這一神經(jīng)運算過程,并沒有明確答案。 為了探索這個問題,中科院腦智卓越中心的研究人員在頭部固定小鼠中建立了一個基于聽覺的分類抉擇行為范式,經(jīng)過訓練,小鼠可以將不同頻率的純音歸類到“高音”或“低音”范疇。 同時,研究人員結合活體雙光子成像技術,在動物執(zhí)行任務的同時對聽覺皮層群體神經(jīng)元活動進行大規(guī)模記錄,并結合進一步的定量分析,從而研究出大腦皮層的神經(jīng)元如何通過動態(tài)編碼將感覺信息轉(zhuǎn)化為類別信息的機制。
基于張江的科學家們提出的感知分類和新的神經(jīng)運算機制,人類在了解自我、認知大腦工作的機制上又邁出了一小步,而這一小步將有助于我們大步邁入人工智能的新時代。 那么對聲音的認知又如何與AI結合,運用到真實的商業(yè)場景中? 隨著5G時代的來臨,科技的變化也將帶來人機交互的變化,在人類聽覺、視覺、觸覺、嗅覺這四感中,聽覺通道無疑占有重要的一席。除了各大互聯(lián)網(wǎng)巨頭扎根智能音箱市場,搶占物聯(lián)網(wǎng)時代的第一入口,動態(tài)聲紋識別技術也在助力金融服務業(yè)向更高階的智能化方向演進。 聲紋識別技術曾經(jīng)歷過很長一段的低潮期,直到2011年,科學家將聲紋識別率提升30%,同時將深度學習引入聲紋識別技術,從此,聲紋識別技術邁入飛速發(fā)展階段。在深度學習的賦能下,如今的聲紋識別技術已經(jīng)相對完善,具有易采集、非接觸、可靠性高等特點。可以確定的是,聲紋識別技術商業(yè)應用的大幕才剛剛拉開,其在金融、安防、社保等領域的廣闊應用場景令人期待。 登錄手機銀行APP,開啟聲紋驗證,用戶只要準確說出隨機動態(tài)碼,系統(tǒng)錄制語音信息,驗證身紋及隨機動態(tài)碼后,就能進行轉(zhuǎn)賬、支付等交易。這是目前很多手機銀行和ATM上推出的聲紋驗證服務。截至2018年底,建設銀行的聲紋用戶已突破100萬,日均交易17萬筆,未發(fā)生一例聲紋識別風險事件。 “每個人的聲紋都是獨一無二的,雖然有些人的聲音聽上去幾乎一模一樣,但他們的聲紋會顯示出差異性?!?/span> 位于張江的數(shù)鏈聯(lián)盟發(fā)起人卞陽解釋說,聲紋是根據(jù)語音波形中反映說話人心理和行為特征的語音參數(shù),聲紋的“唯一性”使其成為打開身份信息大門的鑰匙。識別用戶真實身份,正是金融機構降低壞賬率的關鍵。 卞陽介紹說,在消費金融行業(yè),大部分壞賬來源于黑中介主導的產(chǎn)業(yè)鏈式詐騙,黑中介有多種偽造用戶身份的辦法,單一的身份識別手段無法有效解決問題,聲紋技術的應用將為識別黑中介增加成功的砝碼。具體到應用場景,操作也很簡單。“工作人員打電話給用戶,問一些問題,然后將用戶聲音與聲紋庫的數(shù)據(jù)進行比對,確認用戶是否曾有過騙貸、逾期不還等異常情況?!?卞陽說,“以現(xiàn)有的技術,用戶說話時長只要達到三秒就符合識別的條件?!?/span> 數(shù)鏈聯(lián)盟就將這項技術和區(qū)塊鏈技術相結合,解決“共債查詢”、“反欺詐”、“黑名單共享”等問題。通常認為錄音、變音和語音合成是聲紋識別的攔路虎,但在科學家的加持下,這些難題被攻克。 隨著聲紋識別技術得到金融監(jiān)管部門的認可,憑借著個人隱私保護、身份認證強度方面的優(yōu)勢,“形簡意豐”(包含有內(nèi)容、身份、情感、年齡及健康狀況等豐富的信息)的語音信號正在為金融安全保駕護航,開啟無監(jiān)督情形下一種全新的“聲紋+”身份認證方式。 目前,除了眾多銀行在手機銀行中正式應用了聲紋識別技術,中國銀聯(lián)也在其數(shù)據(jù)平臺的身份認證模塊中集成聲紋識別功能。在互聯(lián)網(wǎng)金融行業(yè),中國互聯(lián)網(wǎng)金融協(xié)會在其統(tǒng)一身份核驗平臺集成了聲紋識別功能,螞蟻金服在支付寶產(chǎn)品、騰訊在微信平臺中也都開始應用聲紋識別作為身份認證的安全手段。無疑,搭載著AI的聲紋識別技術將會在移動金融服務中發(fā)揮更大的作用,相信身處人工智能新高地的張江企業(yè)也有機會從中掘出一桶金。 |
|
來自: 朝朝暮暮ut9wwm > 《待分類》