乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      用實力說話,科大訊飛包攬同聲傳譯三項冠軍!

       skysun000001 2021-08-06

      在2021年國際口語機器翻譯評測比賽(簡稱IWSLT)中,科大訊飛與中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)聯(lián)合團隊在同聲傳譯任務中包攬三個賽道的冠軍!

      圖片

      這到底有多“?!保?/strong>

      說個背景簡單科普一下:

      IWSLT作為國際上最具影響力的口語機器翻譯評測比賽,已經(jīng)舉辦了18年,每年都會有不同的語音翻譯類比賽任務。

      在今年,IWSLT共設置了4類任務,其中包括同傳任務,為考察不同語言對語序的影響以及語音同聲傳譯整體性能,在本次同聲傳譯任務中設置了三個賽道:

      • 英德文本同傳:實時地將英語文本翻譯為德語文本,輸入按詞逐個讀入,系統(tǒng)判斷何時翻譯與輸出;

      • 英日文本同傳:考慮語序差異較大的語種,實時地英語文本翻譯為日語文本;

      • 英德語音同傳:實時地將英語語音直接翻譯成德語文本。

      并通過“翻譯質(zhì)量”和“翻譯延遲”兩個維度來進行評測,以下是英德文本同傳比賽結(jié)果:

      圖片

       ▲英德文本同傳的結(jié)果截圖

      UEDIN:英國愛丁堡大學

      USTC-NESLIP:科大訊飛-中科大聯(lián)合團隊

      APPTEK:AppTek(德國)

      VOLCTRANS:字節(jié)跳動火山翻譯團隊

      訊飛在低中高三個延遲區(qū)間上都顯著優(yōu)于其他系統(tǒng)(注意圖中紅色小星星的位置),并拿下了全部賽道的冠軍!尤其是低延遲環(huán)境下的進展,將進一步推動機器同傳的商業(yè)落地。

      三個賽道詳細的比賽結(jié)果如下:
      圖片圖片圖片

      ▲左右滑動查看成績截圖

      依次為:英德文本同傳效果排名、英日文本同傳效果排名、英德語音同傳效果排名

      我們是怎么做到的?

      一個關鍵原因是,我們創(chuàng)新性地提出了Cross Attention Augmented Transducer(CAAT)同傳架構(gòu),基于這一框架實現(xiàn),可以更好地實現(xiàn)翻譯效果和延遲的平衡,其模型結(jié)構(gòu)如下:

      圖片

      針對同傳任務中翻譯質(zhì)量延遲這兩個評價目標,借鑒語音識別中針對多路徑的優(yōu)化方式,實現(xiàn)了將動態(tài)決策和翻譯效果進行聯(lián)合優(yōu)化,從而在延遲-翻譯質(zhì)量之間找到了更好的平衡。

      怎么理解這句話呢?

      圖片 舉個栗子:

      “你好,他問一下火車站在哪兒?”

      當機器去聽這句話的時候,這些是逐詞輸入到機器的“腦袋”里的,在輸入的過程中,機器就需要根據(jù)自己的模型和策略來做翻譯決策。

      目前經(jīng)典的機器翻譯技術,翻譯策略通常是固定出現(xiàn)N個詞之后開始翻譯。

      例如固定詞數(shù)量是2個,機器在讀到第二個詞“他”時,輸出第一個詞“你好,”的翻譯結(jié)果,即輸出“Hello”;接下來每次讀一個詞,輸出一個詞,讀入“問”,然后輸出“he”,依次類推。當機器看完源端信息時,會把所有結(jié)果一次性輸出。這種策略針對同傳的兩個指標是選擇固定延遲,優(yōu)化翻譯效果,比較機械,很容易造成直譯或預測錯誤問題,尤其是在低延遲的時候。

      而我們的CAAT模型則會根據(jù)輸入和語語義綜合進行分析,當出現(xiàn)“你好”的時候,能夠自主分析“你好”是一個相對完整的語義,不論后面接什么單詞,它的翻譯通常是固定的,則立刻做出決策先翻譯出“Hello”,與此同時,它還會根據(jù)語義進行自主調(diào)序,使得翻譯出來的語言能夠更地道。

      圖片

      ▲具體翻譯策略大概會是圖里的這樣

      相比目前主流的機器翻譯技術,CAAT避免了固定延遲導致的延遲過大或翻譯質(zhì)量下降的問題,在相同延遲下取得翻譯質(zhì)量的顯著提升。

      除了這一模型結(jié)構(gòu)的創(chuàng)新外,針對任務中語音翻譯數(shù)據(jù)量有限這一問題,我們還從模型融合、數(shù)據(jù)增強等策略上進行了優(yōu)化。

      總之,經(jīng)過我們的創(chuàng)新和努力,在尋找到延遲和翻譯質(zhì)量之間更好的平衡點上,我們做到了第一!圖片

      我們的技術用在了哪里?

      圖片 訊飛雙屏翻譯機

      在正反兩面屏幕的加持下,可呈現(xiàn)出同傳級的實時翻譯效果,人們在保持社交距離的同時,還能順暢地對談交流。特別是創(chuàng)新研發(fā)了會話翻譯、錄音翻譯、演講翻譯、同聲字幕等功能,可與手電腦、大屏(電視、投影、會場LED等)實現(xiàn)翻譯聯(lián)動,幫助用戶在跨語言匯報工作、提案演講、遠程開會時提供實時語音翻譯或同傳翻譯字幕。

      圖片

      圖片 訊飛聽見同傳

      它目前已經(jīng)可以支持中、英、日、韓、法、西、俄、阿8國語種的實時轉(zhuǎn)寫,以及中文到英、日、韓、法、西、俄、德、阿拉伯等國語種的翻譯。通過客戶端在會議現(xiàn)場或在線會議實現(xiàn)語音實時識別、翻譯,內(nèi)容記錄,并將識別和翻譯內(nèi)容形成字幕,實時投屏展示。是一款能夠廣泛應用于大型高端會議、發(fā)布會、展覽會等場景的軟件產(chǎn)品。

      圖片

      ▲訊飛聽見同傳為WAIC2021提供轉(zhuǎn)寫翻譯服務

      截至目前,訊飛聽見同傳已服務大會10000 場次,訊飛聽見網(wǎng)站及APP為近1500萬用戶提供智能轉(zhuǎn)寫及翻譯服務,累計轉(zhuǎn)寫時長超3866萬小時。

      圖片

      盡管如此,機器同傳相比與人工同傳來說,有我們不可回避的問題:

      機器翻譯很容易出現(xiàn)“直譯”問題。同時,在語義理解和核心內(nèi)容的傳達上,機器翻譯更容易出現(xiàn)識別和翻譯錯誤等問題。

      站在包攬IWSLT 2021語音同傳任務的三個賽道冠軍的基石上,我們將以本次技術突破為全新的起點,進一步提升科大訊飛在語音翻譯和機器同傳領域的核心競爭力!圖片

      為訊飛技術點贊!圖片

        本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多