人工智能(AI)技術(shù)迅速發(fā)展,強(qiáng)化了語(yǔ)音識(shí)別能力,促使語(yǔ)音成為重要人機(jī)交互接口,應(yīng)用層面從智能手機(jī)拓展到智能音箱、智能電視與車用等終端產(chǎn)品,進(jìn)而帶動(dòng)市場(chǎng)對(duì)麥克風(fēng)旺盛需求。但是,不同類型終端產(chǎn)品需要的麥克風(fēng)陣列不盡相同,所以,各大廠商相繼推出自己的麥克風(fēng)陣列解決方案,也成為廠商競(jìng)爭(zhēng)的一大利器。 語(yǔ)音控制一直被視為是最直觀的操控方式,早在2011年蘋果便推出iPhone手機(jī)語(yǔ)音助理Siri,但當(dāng)時(shí)語(yǔ)音識(shí)別不成熟,導(dǎo)致語(yǔ)音助理成為手機(jī)娛樂(lè)產(chǎn)品。隨著人工智能興起,各大廠商通過(guò)自然語(yǔ)言處理(Natural Language Processing)訓(xùn)練機(jī)器人類語(yǔ)言邏輯、提升語(yǔ)音識(shí)別能力,加上亞馬遜、Google、阿里巴巴與小米等廠商通過(guò)低價(jià)智能音箱打入市場(chǎng),讓消費(fèi)者快速了解語(yǔ)音交互的應(yīng)用范疇,包含信息詢問(wèn)、家電控制與購(gòu)物等,大幅擴(kuò)大語(yǔ)音應(yīng)用的可能性,促使語(yǔ)音成為新的人機(jī)交互接口。 隨著語(yǔ)音應(yīng)用興起,各廠商希望將新人機(jī)交互接口放到自家終端產(chǎn)品,推升麥克風(fēng)需求,其中又以基于MEMS技術(shù)的麥克風(fēng)需求成長(zhǎng)最高。MEMS麥克風(fēng)具備較高的可靠性、穩(wěn)定性與一致性,聲音收集品質(zhì)佳,對(duì)語(yǔ)音識(shí)別有很大幫助。 據(jù)麥姆斯咨詢介紹,因?yàn)楦鞣N智能終端產(chǎn)品的外型、應(yīng)用環(huán)境與使用方式不同,所以使用的MEMS麥克風(fēng)數(shù)量和陣列模型也有差異,從麥克風(fēng)使用數(shù)量來(lái)看,手機(jī)MEMS麥克風(fēng)需求為2~4顆;智能音箱需求范圍較廣,依照產(chǎn)品設(shè)計(jì)和價(jià)格定位,MEMS麥克風(fēng)需求2~8顆不等。 由于智能音箱市場(chǎng)在2017年快速成長(zhǎng),推升整體MEMS麥克風(fēng)產(chǎn)值達(dá)13.81億美元,2018年MEMS麥克風(fēng)進(jìn)一步拓展到電視和可穿戴設(shè)備,產(chǎn)值因此年增11%、達(dá)到15億美元。 汽車是語(yǔ)音應(yīng)用的另一大市場(chǎng),通過(guò)語(yǔ)音控制能讓駕駛?cè)嗽诓灰妻D(zhuǎn)視線的情況下直覺(jué)性操控、提升行車安全,因此車廠開(kāi)始導(dǎo)入語(yǔ)音控制系統(tǒng),其MEMS麥克風(fēng)數(shù)量2~6顆不等,甚至采用更多顆麥克風(fēng)以抑制噪音,有望帶動(dòng)另一波MEMS麥克風(fēng)需求。 遠(yuǎn)距離語(yǔ)音識(shí)別,多麥克風(fēng)系統(tǒng)問(wèn)世 MEMS麥克風(fēng)陣列隨著語(yǔ)音控制需求增加而開(kāi)始受到重視,語(yǔ)音控制存在的環(huán)境相當(dāng)復(fù)雜,若使用時(shí)相隔距離較遠(yuǎn),收音上就會(huì)遇到回音干擾、室內(nèi)混響與多信號(hào)源干擾等問(wèn)題,導(dǎo)致信噪比(SNR)降低,影響語(yǔ)音識(shí)別準(zhǔn)確率。 過(guò)去手機(jī)大多采用單麥克風(fēng),能在低噪音、無(wú)混響與近距離下,獲得信號(hào)品質(zhì)較高的聲音,但當(dāng)環(huán)境中有許多聲源和環(huán)境噪音,例如客廳、廚房與戶外等,就無(wú)法做到聲源分離,進(jìn)而無(wú)法對(duì)聲源定位和識(shí)別。為了遠(yuǎn)距離語(yǔ)音識(shí)別,多麥克風(fēng)系統(tǒng)應(yīng)運(yùn)而生,通過(guò)幾何結(jié)構(gòu)組合成線型、環(huán)型與球型等陣列,數(shù)量從2~1000顆不等,目的是為了收集不同空間方向的聲音信號(hào)來(lái)做噪音抑制、混響去除與人聲干擾抑制后,方能做到聲源側(cè)向,再通過(guò)波束成形做聲音定位。 近年隨著語(yǔ)音識(shí)別能力提高,加上廠商希望縮小產(chǎn)品設(shè)計(jì)并降低成本,因此開(kāi)始減少M(fèi)EMS麥克風(fēng)使用量,一般消費(fèi)性產(chǎn)品采用的MEMS麥克風(fēng)陣列型態(tài)以線型和環(huán)型為主。但線性麥克風(fēng)陣列仍舊有其限制,僅能做到180度聲源定位,無(wú)法針對(duì)全方位做空間指向性,像是亞馬遜第三代Echo Dot就采用4顆麥克風(fēng),雖較前一代減少3顆,但仍是采用環(huán)型陣列。 1. 線型MEMS麥克風(fēng)陣列:寬邊陣列 電視和筆記本電腦等產(chǎn)品適合采用線性麥克風(fēng)陣列中的寬邊陣列,寬邊陣列是指聲波方向和麥克風(fēng)陣列垂直,通過(guò)聲波相加得出聲源方位,且抑制來(lái)自陣列側(cè)邊的聲音,使得前方和后方的響應(yīng)一致,但該陣列具有軸對(duì)稱性,無(wú)法分辨出前方和后方聲源,因此適合聲音僅來(lái)自前方或后方的產(chǎn)品。通過(guò)增加橫向MEMS麥克風(fēng)數(shù)量則能更有效抑制側(cè)邊聲音,借此增加聲源定位距離,不過(guò),MEMS麥克風(fēng)之間若間距過(guò)窄,會(huì)降低低頻衰減、增加低頻噪音干擾,但過(guò)寬又會(huì)造成機(jī)構(gòu)設(shè)計(jì)困難,降低混迭頻率,因此在產(chǎn)品設(shè)計(jì)上需特別衡量橫向麥克風(fēng)數(shù)量與其距離的安排。 以電視為例,其擺放的空間大多在較空曠的客廳,且人往往距離電視較遠(yuǎn),因此電視需搭載遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別讓用戶控制。要強(qiáng)化遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別的能力和距離,需要將數(shù)個(gè)MEMS麥克風(fēng)排列成寬邊陣列,除了可以抑制電視兩側(cè)揚(yáng)聲器所制造的噪音外,也能增強(qiáng)聲源定位距離,但遠(yuǎn)距離容易造成聲音在室內(nèi)不斷反射,導(dǎo)致麥克風(fēng)不斷收到重覆信號(hào),造成語(yǔ)音識(shí)別困難。 2. 線型MEMS麥克風(fēng)陣列:端射陣列 針對(duì)單方向做聲音檢測(cè)的產(chǎn)品,例如手機(jī)、耳機(jī)、助聽(tīng)器、智能手環(huán)與智能手表等產(chǎn)品,就適合采用線性麥克風(fēng)陣列中的端射陣列。端射陣列是指聲波方向與麥克風(fēng)陣列平行,當(dāng)前方比后方先接收到聲波時(shí),就能通過(guò)麥克風(fēng)拾取聲波的時(shí)間差得知聲波來(lái)源,通過(guò)訊號(hào)處理抑制其他方向的聲音干擾,形成空間指向性。 以可穿戴設(shè)備為例,由于產(chǎn)品體積較小,難以通過(guò)多個(gè)麥克風(fēng)做橫向排列抑制周遭噪音,加上消費(fèi)者使用可穿戴設(shè)備做語(yǔ)音控制時(shí),往往會(huì)靠近嘴巴,代表定向聲源只有一個(gè)方向,而需抑制的噪音源同樣是來(lái)自嘴巴,并非聲源的反方向,因此通過(guò)端射陣列設(shè)計(jì),能專注收取單一方向的聲音。 3. 環(huán)型MEMS麥克風(fēng)陣列 環(huán)型MEMS麥克陣列是端射陣列的延伸應(yīng)用,適用于需要針對(duì)全方位做聲源定位和識(shí)別的產(chǎn)品,在設(shè)計(jì)上各MEMS麥克風(fēng)需要等距且均勻分布在圓周上,且排列形成多個(gè)端射陣列,以利針對(duì)不同角度的聲源做降噪、側(cè)向與定位。目前運(yùn)用最廣的語(yǔ)音識(shí)別產(chǎn)品智能音箱,即是使用環(huán)型MEMS麥克風(fēng)陣列。 由于智能音箱在使用上不具備方向性,多擺設(shè)在客廳、廚房與臥房,會(huì)因?yàn)榄h(huán)境多樣性而使得噪聲干擾方式不同,例如在客廳會(huì)受到多信號(hào)源干擾,在廚房則會(huì)受到諸多環(huán)境音干擾,在臥房則可能通過(guò)智能音箱播放音樂(lè),導(dǎo)致噪音出現(xiàn),加上用戶聲音可能來(lái)自四面八方,因此需通過(guò)環(huán)型陣列做波束成形的指向性收音和降噪,提高語(yǔ)音識(shí)別準(zhǔn)確率。 市場(chǎng)百家爭(zhēng)鳴,慎防邊緣化危機(jī) 隨著語(yǔ)音應(yīng)用興起,MEMS麥克風(fēng)陣列成為語(yǔ)音控制系統(tǒng)中第一道關(guān)卡,若MEMS麥克風(fēng)陣列收音狀況不佳,將嚴(yán)重影響識(shí)別準(zhǔn)確率,MEMS麥克風(fēng)陣列解決方案成為各廠商重點(diǎn)角逐的市場(chǎng)。當(dāng)前全球最大的MEMS麥克風(fēng)廠商為樓氏電子(Knowles),市場(chǎng)占有率超過(guò)3成,同時(shí)也掌握MEMS芯片設(shè)計(jì)、MEMS麥克風(fēng)封測(cè)與MEMS麥克風(fēng)陣列模組,備受亞馬遜青睞。 不過(guò),并非所有廠商都有一條龍的生產(chǎn)模式,多數(shù)廠商涵蓋設(shè)計(jì)到封測(cè),或封測(cè)到系統(tǒng)整合廠部分,最后再由系統(tǒng)整合廠將MEMS麥克風(fēng)模組或陣列出貨給品牌廠商。像是意法半導(dǎo)體只提供MEMS芯片設(shè)計(jì)到MEMS麥克風(fēng)封測(cè),原因在于MEMS麥克風(fēng)供應(yīng)鏈呈現(xiàn)金字塔狀,若意法半導(dǎo)體跨足MEMS麥克風(fēng)陣列模組,將會(huì)與原先的合作廠商競(jìng)爭(zhēng);此外,如亞馬遜這類提供語(yǔ)音識(shí)別授權(quán)的業(yè)者,也開(kāi)始進(jìn)入MEMS麥克風(fēng)陣列模組市場(chǎng),將使該市場(chǎng)競(jìng)爭(zhēng)更加激烈。 歌爾股份和瑞聲科技不具備MEMS芯片設(shè)計(jì)能力,僅提供封測(cè)到系統(tǒng)整合,為各類型產(chǎn)品提供不同解決方案,包含智能手機(jī)、可穿戴設(shè)備與智能音箱等,但隨著語(yǔ)音廠商開(kāi)始切入MEMS麥克風(fēng)陣列模組市場(chǎng),該市場(chǎng)競(jìng)爭(zhēng)更加激烈,因此模組廠商開(kāi)始向上游發(fā)展,像是瑞聲科技開(kāi)始自行開(kāi)發(fā)ASIC,不僅能借此優(yōu)化自身MEMS麥克風(fēng)模組,同時(shí)也能增加產(chǎn)品毛利。 歌爾股份則通過(guò)封裝方式將多個(gè)傳感器集成,使得單一元件擁有多種功能,減少基板使用面積而具有成本優(yōu)勢(shì)。此外,部分聲學(xué)廠商同時(shí)提供代工服務(wù),例如歌爾股份、共達(dá)電聲、奮達(dá)科技與美律等,皆提供智能音箱和耳機(jī)的代工,優(yōu)勢(shì)在于聲學(xué)相關(guān)產(chǎn)品的機(jī)構(gòu)設(shè)計(jì)是聲學(xué)廠商強(qiáng)項(xiàng),且能直接提供聲學(xué)模組給品牌廠商。 近期語(yǔ)音廠商開(kāi)始朝麥克風(fēng)陣列模組發(fā)展,原因在于語(yǔ)音廠商希望達(dá)到最佳語(yǔ)音識(shí)別準(zhǔn)確率,若采取非官方認(rèn)證的麥克風(fēng)陣列,語(yǔ)音識(shí)別可能會(huì)出現(xiàn)誤差,導(dǎo)致消費(fèi)者體驗(yàn)不佳。因此,為了讓實(shí)際收音和訓(xùn)練樣本一致,語(yǔ)音識(shí)別業(yè)者開(kāi)始推出麥克風(fēng)陣列解決方案,像是亞馬遜、科大訊飛與阿里巴巴等,都提供相關(guān)解決方案,此外,語(yǔ)音識(shí)別業(yè)者可以通過(guò)麥克風(fēng)陣列模組進(jìn)行語(yǔ)音數(shù)據(jù)搜集,以優(yōu)化自家語(yǔ)音識(shí)別,同時(shí)也能擴(kuò)大自家生態(tài)圈,從而拓展到更多產(chǎn)品,可謂一舉數(shù)得。 然而,語(yǔ)音識(shí)別業(yè)者跨入,導(dǎo)致下游MEMS麥克風(fēng)陣列模組市場(chǎng)開(kāi)始出現(xiàn)變化,語(yǔ)音識(shí)別業(yè)者通過(guò)軟硬整合方式吸引廠商采用,廠商則能直接進(jìn)入語(yǔ)音識(shí)別業(yè)者的生態(tài)圈中,這對(duì)硬件開(kāi)發(fā)商而言,是有相當(dāng)強(qiáng)的吸引力。 面對(duì)語(yǔ)音識(shí)別業(yè)者的擠壓,原先的麥克風(fēng)陣列模組廠商開(kāi)始朝上游或代工發(fā)展,借此強(qiáng)化自身產(chǎn)品競(jìng)爭(zhēng)力,否則只能轉(zhuǎn)向中低端市場(chǎng),最終面臨被市場(chǎng)邊緣化的風(fēng)險(xiǎn)。 |
|