![]() 編輯/排版:卒見(jiàn) 現(xiàn)在我們工作會(huì)議的時(shí),都會(huì)用到錄音轉(zhuǎn)文字工具,我個(gè)人也會(huì)在工作和娛樂(lè)的時(shí)候用到這些工具,這里就給大家分享幾款不一樣的語(yǔ)音轉(zhuǎn)文字工具,都是免費(fèi)、開(kāi)源項(xiàng)目! 01 Voice-Pro AI 語(yǔ)音轉(zhuǎn)換和多語(yǔ)言翻譯工具 Voice-Pro 是一款由AI驅(qū)動(dòng)的Web開(kāi)源應(yīng)用程序,旨在徹底改變多媒體內(nèi)容處理。 ![]() 它集轉(zhuǎn)錄、翻譯和文字轉(zhuǎn)語(yǔ)音為一體,提供簡(jiǎn)潔直觀的可視化操作界面,支持實(shí)時(shí)轉(zhuǎn)錄和翻譯,以及批量處理模式。 ![]() 它具有 YouTube 視頻下載、語(yǔ)音分離、語(yǔ)音識(shí)別、翻譯和文本轉(zhuǎn)語(yǔ)音的全面功能。 ![]() Voice-Pro 安裝。 ①運(yùn)行configure.bat 并start.bat ②克隆或下載最新版本(源代碼 zip)GitHub 版本 git clone https://github.com/abus-aikorea/voice-pro.git ③運(yùn)行configure.bat,在 Windows 上安裝 git、ffmpeg 和 CUDA ④連接互聯(lián)網(wǎng),這個(gè)過(guò)程可能需要一個(gè)多小時(shí),看系統(tǒng)情況。 ⑤在安裝過(guò)程中,請(qǐng)勿關(guān)閉 Windows-Command 窗口。 ![]() ⑥啟動(dòng) Voice-Pro。Web-UI 將自動(dòng)運(yùn)行。 首次運(yùn)行時(shí),請(qǐng)先安裝 Voice-Pro。 如果在安裝過(guò)程中出現(xiàn)問(wèn)題,請(qǐng)刪除 installer_files 文件夾并再次運(yùn)行 start.bat。 ![]() 該項(xiàng)目是用于音頻處理的綜合 Gradio WebUI,具有 Voice Changer、零樣本語(yǔ)音克?。‥2、F5-TTS)、YouTube 下載、語(yǔ)音隔離 (UVR5)、文本轉(zhuǎn)語(yǔ)音 (Edge-TTS) 和多語(yǔ)言翻譯。適用于內(nèi)容創(chuàng)建者和開(kāi)發(fā)人員。 Voice-Pro源代碼: https://pan./s/ccbde0108f7f 開(kāi)源地址: https://github.com/abus-aikorea/voice-pro 02 PodCastLM PDF 生成中文播客! 一款開(kāi)源免費(fèi)的工具,可以將 PDF 內(nèi)容轉(zhuǎn)化為適合音頻播客的自然對(duì)話,并輸出為 MP3 文件。 操作很簡(jiǎn)單: ①我們可以直接將需要轉(zhuǎn)換的內(nèi)容上傳到操作頁(yè)面,這里可上傳1M以內(nèi)的PDF文件; ![]() ②然后設(shè)置語(yǔ)氣、時(shí)長(zhǎng)等,生成播客,你可以查看到文本總結(jié)內(nèi)容,以及整理后的腳本內(nèi)容! ![]() ③點(diǎn)擊底部音頻按鈕,即可播放當(dāng)前整理好的內(nèi)容! ![]() 開(kāi)源地址: https://github.com/YOYZHANG/PodCastLM 在線地址:https://ai. 03 video-srt-windows 自動(dòng)識(shí)別視頻語(yǔ)音生成字幕文件的工具 video-srt-windows是一個(gè)可以識(shí)別視頻語(yǔ)音自動(dòng)生成字幕SRT文件的開(kāi)源 Windows-GUI 軟件工具。 ![]() 它采用 Go+walk 開(kāi)發(fā),僅支持 Windows 系統(tǒng)?;A(chǔ)原理是請(qǐng)求在線語(yǔ)音轉(zhuǎn)文字的服務(wù),超出免費(fèi)額度需付費(fèi)。另外還加入了導(dǎo)出字幕文件和翻譯功能。 VideoSrt下載: https://pan./s/ebd97ead46e3 開(kāi)源地址: https://github.com/wxbool/video-srt-windows https:///gh_mirrors/vi/video-srt-windows 04 buzz 音頻轉(zhuǎn)錄與翻譯工具,可以在你的個(gè)人計(jì)算機(jī)上離線轉(zhuǎn)錄和翻譯音頻服務(wù)。 ![]() 該項(xiàng)目是基于 Whisper 的音頻轉(zhuǎn)錄和翻譯工具,開(kāi)箱即用、操作簡(jiǎn)單,支持語(yǔ)音轉(zhuǎn)文字、音頻翻譯、多種語(yǔ)言和離線使用! ![]() Mac 原生版本的 Buzz,具有更簡(jiǎn)潔的外觀、音頻播放、拖放導(dǎo)入、轉(zhuǎn)錄文本編輯、搜索等功能。它同時(shí)適用于Windows 和 Linux 平臺(tái)。 ![]() 功能支持: ①導(dǎo)入音頻和視頻文件并將轉(zhuǎn)錄文本導(dǎo)出為 TXT、SRT 和 VTT(演示) ②從計(jì)算機(jī)的麥克風(fēng)轉(zhuǎn)錄和翻譯為文本 ![]() ③支持Whisper、Whisper.cpp、Faster Whisper、Whisper兼容的 Hugging Face 模型,以及 OpenAI Whisper API ④命令行界面 ![]() Buzz v1.2.0下載: https://pan./s/8c08670cfe56 開(kāi)源地址: https://github.com/chidiwilliams/buzz 05 ChatTTS SOTA 開(kāi)源 TTS,強(qiáng)大的對(duì)話式文本轉(zhuǎn)語(yǔ)音模型,專(zhuān)門(mén)為對(duì)話場(chǎng)景設(shè)計(jì),支持中、英雙語(yǔ)。生成較短的語(yǔ)音效果很好,無(wú)機(jī)械感! ![]() 它主要用于 LLM 助手對(duì)話任務(wù)、對(duì)話語(yǔ)音以及視頻介紹等,支持中英文混合文本合成語(yǔ)音,音色表現(xiàn)強(qiáng),能達(dá)到真假難辨程度。 ![]() 它不僅能夠生成自然、流暢的語(yǔ)音,還能控制和添加笑聲、停頓和語(yǔ)氣詞等。 ChatTTS源代碼: https://pan./s/48101f70fc83 開(kāi)源地址: https://github.com/2noise/ChatTTS 06 fish-speech 所有人都能用的開(kāi)源語(yǔ)音合成模型 該項(xiàng)目是由 Fish Audio 開(kāi)發(fā)的基于 VQGAN+Llama 的文本轉(zhuǎn)語(yǔ)音模型,它僅需 4GB 顯存即可在個(gè)人設(shè)備上輕松運(yùn)行和微調(diào)(16GB),支持中英日語(yǔ)和音色調(diào)整,語(yǔ)音合成效果出色。 ![]() fish-speech源代碼: https://pan./s/cf829869e7f0 開(kāi)源地址: https://github.com/fishaudio/fish-speech 07 GPT-SoVITS 少樣本語(yǔ)音轉(zhuǎn)換和合成工具 強(qiáng)大的少樣本語(yǔ)音轉(zhuǎn)換和語(yǔ)音合成 WebUI 工具,輸入 5 秒的聲音樣本就能體驗(yàn)文本到語(yǔ)音轉(zhuǎn)換。支持少樣本 TTS、英語(yǔ)、日語(yǔ)和中文,集成了聲音伴奏分離、中文自動(dòng)語(yǔ)音識(shí)別和文本標(biāo)注等功能。 ![]() 特色功能: 零點(diǎn)TTS:輸入5秒的人聲樣本并體驗(yàn)即時(shí)文本到語(yǔ)音轉(zhuǎn)換。 少發(fā)TTS:只需1分鐘的訓(xùn)練數(shù)據(jù)即可微調(diào)模型,以提高語(yǔ)音相似度和真實(shí)感。 ![]() 跨語(yǔ)言支持:使用與訓(xùn)練數(shù)據(jù)集不同的語(yǔ)言進(jìn)行推理,目前支持英語(yǔ)、日語(yǔ)、韓語(yǔ)、粵語(yǔ)和中文。 WebUI 工具:集成工具包括語(yǔ)音伴奏分離、自動(dòng)訓(xùn)練集分割、中文 ASR 和文本標(biāo)注,幫助初學(xué)者創(chuàng)建訓(xùn)練數(shù)據(jù)集和 GPT/SoVITS 模型。 ![]() 開(kāi)源地址: https://github.com/RVC-Boss/GPT-SoVITS kua鏈: https://pan./s/cf509d794f54 du鏈: https://pan.baidu.com/s/1AQwPg3B60RlozShq97h4_g?pwd=gecp 提取碼: gecp Ok,本期的分享就到這里了,希望以上語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音的工具可以幫助你,不管是在生活上,還是在工作中,提高效率! |
|
來(lái)自: 語(yǔ)倅樓 > 《待分類(lèi)》