乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      媲美真人配音!微軟語音合成助手

       qingse1976 2022-10-12 發(fā)布于河北

      AI 技術(shù)在飛速發(fā)展,比如美顏換臉、文字識別語音識別、移除圖片背景、自動駕駛等等都在生活的各個方面起到了應(yīng)用。而「語音合成 TTS」方面,如今實用性也已非常驚人了。

      騰訊云阿里云、百度云等都推出文字轉(zhuǎn)語音在線服務(wù) API,但合成的人聲大多時候都很容易聽出“機器人味”。而微軟Azure TTS 文本轉(zhuǎn)語音服務(wù)效果就比較讓人驚嘆了!它擁有多種聲音和情感風(fēng)格,能像真人一樣朗讀出抑揚頓挫,使得合成的人聲非常逼真自然,不妨來看看……

      微軟自然語音轉(zhuǎn)換 - 像真人般將文本朗讀出來并保存成音頻

      微軟文本轉(zhuǎn)語音Azure Text to Speech 是一個能將文字轉(zhuǎn)換成真人般自然朗讀的云服務(wù),相比同類 TTS 強大之處在于,它借助 AI 神經(jīng)網(wǎng)絡(luò)技術(shù),讓合成的語音擁有媲美真人的表現(xiàn)力,實現(xiàn)人聲語調(diào)與情感匹配,朗讀時能表現(xiàn)出高興、悲傷、新聞廣播、客服、恐懼、耳語等情感。

      微軟語音合成助手 Azure TTS

      加上語速、語調(diào)、發(fā)音、停頓都可以由用戶調(diào)節(jié),實際生成的語音非常自然逼真!完全不再像機器人了!因此微軟文本轉(zhuǎn)語音技術(shù)幾乎能應(yīng)用在任何場景。新版的 Edge 瀏覽器的朗讀功能就是基于此技術(shù)而來??上Т朔?wù)是付費的,你還懂編程才能用上它,這似乎離普通用戶很遠?

      別急!其實,微軟提供了一個免費的在線 DEMO 演示,可以讓用戶隨便輸入文字實現(xiàn)在線試聽 (但字?jǐn)?shù)有限制,且試聽無法保存)。于是,高手們紛紛各顯神通,給我們帶來了幾款如微軟語音合成助手、Edge-TTS-record、微軟 TTS 下載按鈕腳本插件等免費工具,可以幫助你將一大段文字轉(zhuǎn)換成音頻導(dǎo)出 mp3 或錄制成 wav 保存下來,用于其他地方。

      微軟 TTS 朗讀效果預(yù)覽:

      我們先來聽幾段微軟文本轉(zhuǎn)語音的效果吧,相信你一定能聽出來,它真的比目前大多數(shù) TTS 同行要優(yōu)秀很多,情感表現(xiàn)力簡直滿分!開心、嚴(yán)肅不同場景可以用不同的調(diào)調(diào),就連講個鬼故事也都能講出害怕的感覺。

      點擊開始播放視頻

      其實如今在嗶哩嗶哩、抖音、快手里好多視頻的配音,都有使用了這個微軟語音庫來生成,人的聲音聽起來很自然,不特意地去留意,基本都分辨不出來是用機器合成的。

      微軟語音合成助手免費版 (Windows)

      微軟語音合成助手」是一款完全免費的文字轉(zhuǎn)語音的 Windows 電腦版軟件,它綠色免安裝,而且體積小巧,打開就能使用 (需聯(lián)網(wǎng)),軟件界面非常簡潔,上手即會使用。

      微軟語音合成助手 Azure TTS

      它完全借助了微軟的 Azure TTS 服務(wù)來將文字合成并生成語音,支持在線試聽,也可以保存成 mp3 音頻文件,效果非常接近真人朗讀!不僅真實自然,而且也能設(shè)置它的情感風(fēng)格、語速、停頓、音量等等。

      微軟語音合成助手可以支持導(dǎo)入 TXT、SRT 字幕、PDF 多種格式的文檔文件,甚至還能支持 JPG、PNG 截圖里的文字識別并導(dǎo)入成文本內(nèi)容。并且重點是,此軟件使用了分段下載合并的方式解決了一次只能轉(zhuǎn)換 2500 個字?jǐn)?shù)限制的問題。

      軟件支持保存導(dǎo)出編輯內(nèi)容,支持翻譯,自動排版,自動標(biāo)點,文本替換,敏感詞提醒,敏感詞替換,SSML 多人語音混編等多種功能,還可以實現(xiàn)批量轉(zhuǎn)換。

      瀏覽器插件:微軟 TTS 下載音頻按鈕(油猴腳本)

      前面說到,微軟 TTS 本身提供了文字轉(zhuǎn)語音的在線演示的網(wǎng)頁版,可以讓用戶在瀏覽器上輸入或粘貼文本,轉(zhuǎn)換成語音進行試聽,但官網(wǎng)上并不提供下載功能。因此,有開發(fā)者制作了這么一個「微軟 TTS 下載音頻按鈕」插件,可以讓你將試聽的語音下載保存成 MP3 音頻。

      微軟 TTS 語音下載按鈕插件

      這款瀏覽器插件是完全免費的,它是以 UserScript (油猴腳本) 的形式提供的,比如 Chrome、Edge 等瀏覽器安裝了 Tempermonkey 插件后就能安裝此類腳本。安裝成功并啟用的話,微軟 TTS 的網(wǎng)頁上除了試聽按鈕以外,還會如上圖一樣,增加一個「下載音頻」的按鈕。

      所以,如果你使用 MacLinux 或者不希望下載第三方軟件,那么使用此腳本也可以在瀏覽器里搞定文本轉(zhuǎn)音頻。

      Edge-TTS-record 開源錄制工具

      這款開源免費的「edge-TTS-record」工具,是一款可以錄制 Microsoft Edge 瀏覽器的語音合成(TTS)語音并輸出為 .wav 音頻的 Windows 版工具。另外,網(wǎng)上也有一款名為「Read Aloud by asup」的工具與此程序幾乎一樣,暫不知道是否同一作者。

      Edge TTS record 微軟語音錄制工具

      由于 Edge 瀏覽器也是使用了微軟 Azure TTS 的技術(shù),因此它擁有了同樣的逼真自然的聲音引擎,包括了曉曉、云楊等人物聲音。不過相比前兩者,此工具的實現(xiàn)方法是需要將試聽的聲音進行“錄音”而來的,因此錄制時間較長,同時過程中也可能受到系統(tǒng)其他軟件聲音的影響。

      aspeak - 命令行文字轉(zhuǎn)語音工具:

      對于有特殊需求的朋友,還有一款命令行版的微軟 TTS 語音合成工具 aspeak,這是用 Python 編寫的基于 Azure 語音合成的命令行程序,安裝簡單,還可以跨平臺使用。

      #安裝 aspeak
      pip install --upgrade aspeak
      
      # 最簡單的例子:
      aspeak -t "異次元軟件世界,你好呀!" -l zh-CN
      
      #導(dǎo)入 .txt 文件,并轉(zhuǎn)換成 .wav 音頻保存
      aspeak -f input.txt -l zh-CN -o ouput.wav

      更多具體的參數(shù),比如怎樣指定語音,大家可以看 aspeak 的官方文檔。至于此工具的的實際應(yīng)用例子嘛,就得看大家發(fā)揮想象力和二次開發(fā)的能力了。

      總結(jié):

      不管你是視頻 UP 主、自媒體還是辦公人士,借助微軟 Azure TTS 的語音合成引擎來不僅能錄制一些旁白、朗讀稿子電子書、給視頻配音等,也能自娛自樂,給生活和工作都帶來方便與樂趣。

      上面的幾款工具都是免費的,感興趣和有需要的朋友都可以下載使用。當(dāng)然了,微軟這個 TTS 云服務(wù)接口本來是需要付費的,而這些免費工具都是基于微軟的免費 Demo 演示開發(fā)而來,哪一天要是被關(guān)掉了,可能就無法使用了。所以,免費有限,大家且用且珍惜吧……

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多