隨著發(fā)改委連同科技部、工信部、網信辦日前印發(fā)的《“互聯網+”人工智能三年行動實施方案》的出爐,未來5年內人工智能技術將在家居、汽車、無人系統(tǒng)、安防等領域進行推廣應用。面對人工智能的不斷發(fā)展,全球互聯網巨頭也紛紛在人工智能領域加強技術創(chuàng)新和產品布局,“AI革命”的帷幕已經悄然拉開。 與此同時,在這場“人工智能時代”的革命中,許多方面的問題也需要不斷的進行研究和探索,例如深度學習與數據挖掘、自然語言理解、智能信息檢索、語音識別等。為了讓大家更好的了解人工智能,5月21日和5月22日,EGO特別邀請到Mobvista首席算法架構師&總監(jiān)李海波、明略數據技術合伙人兼數據科學家黃文堅和科大訊飛云平臺事業(yè)部技術總監(jiān)吳江照,分別在廣州、深圳成功舉辦了EGO深圳/廣州分會人工智能專題月活動。 下午2點10分,在活動開場之后,三位特邀嘉賓為大家?guī)砹司实难葜v: 推薦系統(tǒng)與變現系統(tǒng)的同途殊歸 李海波,Mobvista首席算法架構師&總監(jiān) 雖然推薦系統(tǒng)和變現系統(tǒng)在底層技術上,包括數據挖掘、機器學習、LTR、個性化技術等方面都是通用的,甚至在架構方面,包括觸發(fā)、Ranking和預估也頗為相似,但是二者在目標、item和排序上有著較大的差異。 從目標角度來說,我覺得這是推薦系統(tǒng)和變現系統(tǒng)非常重要的不一樣的點,推薦系統(tǒng)非常重視用戶體驗,但是對于變現系統(tǒng)來說其實沒有必要,這只是作為一個門檻,在不損傷用戶體驗的情況下在很多時候很多公司都會將收益作為第一目標。 在item方面二者也是不一樣的,變現系統(tǒng)的候選庫就是廣告,這些廣告都是廣告主提過來的,對于推薦系統(tǒng)來說的話,它的候選庫是單品庫,在排序方面,變現系統(tǒng)會有很多競價的策略、競價的機制。這個也是很重要的一個點,在變現系統(tǒng)里面會設置一些競爭的機制使廣告主參與到這些競爭里面來,這些機制就是它設定一個價格讓你感覺到你能用更少的錢去獲取流量,但其實從整個大范圍看的話它會把整個價格提升上來,這個在推薦系統(tǒng)里面是不會有的。
對于深度學習,我不會講一些特別細節(jié)的技術原理,主要想跟大家講一下深度學習的應用。首先,我們來看看深度學習可以做什么,Google研究的無人駕駛其組件由兩個部分組成:眼睛和大腦,眼睛是激光測距儀和視頻攝像頭,汽車收集到這些視頻信號后,并不能很好的識別,為了讓汽車能夠理解我們需要一個大腦,這個大腦就是深度學習,通過深度學習我們可以告訴我們的車載計算機現在前面有什么物體并能夠結構化的抽取出來。除此之外,還有人臉識別技術、戰(zhàn)勝李世石的AlphaGo等,它們都是深度學習的具體應用案例。 深度學習非常像人的學習過程,你必須一層一層的抽象才能理解更深的概念,之所以叫深度學習是因為有多層的學習網絡,每一層是把特征抽象更高階的概念,理解非常復雜的事物。深度學習在明略項目中有很多的應用,如中國中車故障分析及預測,使用深度學習對傳感器信號的幾百萬次信號檢測數值的時間序列進行分析,使用CNN以及RNN進行建模,這可以大大提高我們對故障的分類預測。 訊飛智能語音開放平臺構建之路
我這次主要想從快、智、穩(wěn)、易四個方面跟大家分享一下科大訊飛在智能語音識領域的一些思路和探索,首先是“快”,在網絡良好的情況下,我們現在的語音識別響應時間不超過200毫秒,為了做到這一點,我們從VAD、編解碼、協議和算法這四個方面進行優(yōu)化。 從“智”的角度來說,我們的語音識別在通用的識別領域可以做到97%左右的識別率,如果加上個性化語音識別,我們大概可以做到98%的語音識別率,對于通用模型,我們每天都會在后臺對數據進行不斷的迭代優(yōu)化,我們每周都會更新模型的版本,保證用戶說出來的話尤其是一些熱詞可以實時的喊出來,比如猴賽雷等網絡熱詞。除此之外,我們也要解決人聽懂的問題,對此,我們有一個語義理解,它需要依托前面模式識別產生的數據信息送到語義理解的系統(tǒng)中,它會基于用戶多個維度的信息來理解當前用戶指令,從而獲得個性化的體驗。 從開放平臺“穩(wěn)”的角度來看,我們每天大概要應對20億次的服務量,這對我們來說還是一個蠻大的挑戰(zhàn),對于IDC機房來說,除了電信、移動和聯通這三大主流的IDC以外,還有一些其他的IDC機房,我們作為提供云服務的廠商,在選取IDC機房的時候也考慮到這樣的一個情況,所以我們選了北京、廣州、合肥和移動是目前我們已經有的,同時每個IDC機房都采用BGP或三網接入,保證接入的速率和成功率。在考慮前面幾點的同時也要考慮到系統(tǒng)“易”擴展性,比如在SDK、業(yè)務服務層面都是很容易去擴展的。
|
|