乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      7款少有人知的語(yǔ)音轉(zhuǎn)文字黑科技軟件,開(kāi)源免費(fèi)強(qiáng)大!

       語(yǔ)倅樓 2025-01-04 發(fā)布于上海

      編輯/排版:卒見(jiàn)

      現(xiàn)在我們工作會(huì)議的時(shí),都會(huì)用到錄音轉(zhuǎn)文字工具,我個(gè)人也會(huì)在工作和娛樂(lè)的時(shí)候用到這些工具,這里就給大家分享幾款不一樣的語(yǔ)音轉(zhuǎn)文字工具,都是免費(fèi)、開(kāi)源項(xiàng)目!

      01

      Voice-Pro

      AI 語(yǔ)音轉(zhuǎn)換和多語(yǔ)言翻譯工具

      Voice-Pro 是一款由AI驅(qū)動(dòng)的Web開(kāi)源應(yīng)用程序,旨在徹底改變多媒體內(nèi)容處理。

      它集轉(zhuǎn)錄、翻譯和文字轉(zhuǎn)語(yǔ)音為一體,提供簡(jiǎn)潔直觀的可視化操作界面,支持實(shí)時(shí)轉(zhuǎn)錄和翻譯,以及批量處理模式。

      它具有 YouTube 視頻下載、語(yǔ)音分離、語(yǔ)音識(shí)別、翻譯和文本轉(zhuǎn)語(yǔ)音的全面功能。

      Voice-Pro 安裝。

      ①運(yùn)行configure.bat 并start.bat

      ②克隆或下載最新版本(源代碼 zip)GitHub 版本

      git clone https://github.com/abus-aikorea/voice-pro.git

      ③運(yùn)行configure.bat,在 Windows 上安裝 git、ffmpeg 和 CUDA

      ④連接互聯(lián)網(wǎng),這個(gè)過(guò)程可能需要一個(gè)多小時(shí),看系統(tǒng)情況。

      ⑤在安裝過(guò)程中,請(qǐng)勿關(guān)閉 Windows-Command 窗口。

      ⑥啟動(dòng) Voice-Pro。Web-UI 將自動(dòng)運(yùn)行。

      首次運(yùn)行時(shí),請(qǐng)先安裝 Voice-Pro。

      如果在安裝過(guò)程中出現(xiàn)問(wèn)題,請(qǐng)刪除 installer_files 文件夾并再次運(yùn)行 start.bat。

      該項(xiàng)目是用于音頻處理的綜合 Gradio WebUI,具有 Voice Changer、零樣本語(yǔ)音克?。‥2、F5-TTS)、YouTube 下載、語(yǔ)音隔離 (UVR5)、文本轉(zhuǎn)語(yǔ)音 (Edge-TTS) 和多語(yǔ)言翻譯。適用于內(nèi)容創(chuàng)建者和開(kāi)發(fā)人員。

      Voice-Pro源代碼:

      https://pan./s/ccbde0108f7f

      開(kāi)源地址:

      https://github.com/abus-aikorea/voice-pro

      02

      PodCastLM

      PDF 生成中文播客!

      一款開(kāi)源免費(fèi)的工具,可以將 PDF 內(nèi)容轉(zhuǎn)化為適合音頻播客的自然對(duì)話,并輸出為 MP3 文件。

      操作很簡(jiǎn)單:

      ①我們可以直接將需要轉(zhuǎn)換的內(nèi)容上傳到操作頁(yè)面,這里可上傳1M以內(nèi)的PDF文件;

      ②然后設(shè)置語(yǔ)氣、時(shí)長(zhǎng)等,生成播客,你可以查看到文本總結(jié)內(nèi)容,以及整理后的腳本內(nèi)容!

      ③點(diǎn)擊底部音頻按鈕,即可播放當(dāng)前整理好的內(nèi)容!

      開(kāi)源地址:

      https://github.com/YOYZHANG/PodCastLM

      在線地址:https://ai.

      03

      video-srt-windows

      自動(dòng)識(shí)別視頻語(yǔ)音生成字幕文件的工具

      video-srt-windows是一個(gè)可以識(shí)別視頻語(yǔ)音自動(dòng)生成字幕SRT文件的開(kāi)源 Windows-GUI 軟件工具。

      它采用 Go+walk 開(kāi)發(fā),僅支持 Windows 系統(tǒng)?;A(chǔ)原理是請(qǐng)求在線語(yǔ)音轉(zhuǎn)文字的服務(wù),超出免費(fèi)額度需付費(fèi)。另外還加入了導(dǎo)出字幕文件和翻譯功能。

      VideoSrt下載:

      https://pan./s/ebd97ead46e3

      開(kāi)源地址:

      https://github.com/wxbool/video-srt-windows

      https:///gh_mirrors/vi/video-srt-windows

      04

      buzz

      音頻轉(zhuǎn)錄與翻譯工具,可以在你的個(gè)人計(jì)算機(jī)上離線轉(zhuǎn)錄和翻譯音頻服務(wù)。

      該項(xiàng)目是基于 Whisper 的音頻轉(zhuǎn)錄和翻譯工具,開(kāi)箱即用、操作簡(jiǎn)單,支持語(yǔ)音轉(zhuǎn)文字、音頻翻譯、多種語(yǔ)言和離線使用!

      Mac 原生版本的 Buzz,具有更簡(jiǎn)潔的外觀、音頻播放、拖放導(dǎo)入、轉(zhuǎn)錄文本編輯、搜索等功能。它同時(shí)適用于Windows 和 Linux 平臺(tái)。

      功能支持:

      ①導(dǎo)入音頻和視頻文件并將轉(zhuǎn)錄文本導(dǎo)出為 TXT、SRT 和 VTT(演示)

      ②從計(jì)算機(jī)的麥克風(fēng)轉(zhuǎn)錄和翻譯為文本

      ③支持Whisper、Whisper.cpp、Faster Whisper、Whisper兼容的 Hugging Face 模型,以及 OpenAI Whisper API

      ④命令行界面

      Buzz v1.2.0下載:

      https://pan./s/8c08670cfe56

      開(kāi)源地址:

      https://github.com/chidiwilliams/buzz

      05

      ChatTTS

      SOTA 開(kāi)源 TTS,強(qiáng)大的對(duì)話式文本轉(zhuǎn)語(yǔ)音模型,專(zhuān)門(mén)為對(duì)話場(chǎng)景設(shè)計(jì),支持中、英雙語(yǔ)。生成較短的語(yǔ)音效果很好,無(wú)機(jī)械感!

      它主要用于 LLM 助手對(duì)話任務(wù)、對(duì)話語(yǔ)音以及視頻介紹等,支持中英文混合文本合成語(yǔ)音,音色表現(xiàn)強(qiáng),能達(dá)到真假難辨程度。

      它不僅能夠生成自然、流暢的語(yǔ)音,還能控制和添加笑聲、停頓和語(yǔ)氣詞等。

      ChatTTS源代碼:

      https://pan./s/48101f70fc83

      開(kāi)源地址:

      https://github.com/2noise/ChatTTS

      06

      fish-speech

      所有人都能用的開(kāi)源語(yǔ)音合成模型

      該項(xiàng)目是由 Fish Audio 開(kāi)發(fā)的基于 VQGAN+Llama 的文本轉(zhuǎn)語(yǔ)音模型,它僅需 4GB 顯存即可在個(gè)人設(shè)備上輕松運(yùn)行和微調(diào)(16GB),支持中英日語(yǔ)和音色調(diào)整,語(yǔ)音合成效果出色。

      fish-speech源代碼:

      https://pan./s/cf829869e7f0

      開(kāi)源地址:

      https://github.com/fishaudio/fish-speech

      07

      GPT-SoVITS

      少樣本語(yǔ)音轉(zhuǎn)換和合成工具

      強(qiáng)大的少樣本語(yǔ)音轉(zhuǎn)換和語(yǔ)音合成 WebUI 工具,輸入 5 秒的聲音樣本就能體驗(yàn)文本到語(yǔ)音轉(zhuǎn)換。支持少樣本 TTS、英語(yǔ)、日語(yǔ)和中文,集成了聲音伴奏分離、中文自動(dòng)語(yǔ)音識(shí)別和文本標(biāo)注等功能。

      特色功能:

      零點(diǎn)TTS:輸入5秒的人聲樣本并體驗(yàn)即時(shí)文本到語(yǔ)音轉(zhuǎn)換。

      少發(fā)TTS:只需1分鐘的訓(xùn)練數(shù)據(jù)即可微調(diào)模型,以提高語(yǔ)音相似度和真實(shí)感。

      跨語(yǔ)言支持:使用與訓(xùn)練數(shù)據(jù)集不同的語(yǔ)言進(jìn)行推理,目前支持英語(yǔ)、日語(yǔ)、韓語(yǔ)、粵語(yǔ)和中文。

      WebUI 工具:集成工具包括語(yǔ)音伴奏分離、自動(dòng)訓(xùn)練集分割、中文 ASR 和文本標(biāo)注,幫助初學(xué)者創(chuàng)建訓(xùn)練數(shù)據(jù)集和 GPT/SoVITS 模型。

      開(kāi)源地址:

      https://github.com/RVC-Boss/GPT-SoVITS

      kua鏈:

      https://pan./s/cf509d794f54

      du鏈:

      https://pan.baidu.com/s/1AQwPg3B60RlozShq97h4_g?pwd=gecp

      提取碼: gecp

      Ok,本期的分享就到這里了,希望以上語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音的工具可以幫助你,不管是在生活上,還是在工作中,提高效率!

      ?5款鮮有人知的剪輯黑科技app

      ?5款堪稱(chēng)神器的黑科技軟件

      ?強(qiáng)烈推薦4款Windows工具神器

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約