在以往,我們要給數(shù)字人對(duì)口型,或者讓圖片數(shù)字人開(kāi)口說(shuō)話,會(huì)使用開(kāi)源的 SadTalker、Wav2Lip 等工具,或者使用 Heygen、D-ID等付費(fèi)工具。
這幾個(gè)工具,不管從安裝部署,還是資金投入,成本都不低。
體驗(yàn)了一下最近字節(jié)的即夢(mèng)新上線的對(duì)口型功能,發(fā)現(xiàn)效果挺不錯(cuò)的,過(guò)來(lái)分享給你們。
即夢(mèng)的「對(duì)口型」支持圖片開(kāi)口說(shuō)話,或者視頻對(duì)口型。
而要讓數(shù)字人說(shuō)話,可以使用「文本朗讀」或者「上傳本地配音」來(lái)驅(qū)動(dòng)。
這里,我使用一張圖片,并用文本驅(qū)動(dòng)的形式,生成圖片數(shù)字人。
在使用文本驅(qū)動(dòng)時(shí),即夢(mèng)系統(tǒng)給我們提供了多個(gè)類(lèi)型的語(yǔ)音朗讀,男女老少,仿真模擬都有了。
如果,我們想讓說(shuō)話的數(shù)字人情緒很飽滿一些,可以選擇「生成效果」中的「生動(dòng)」模式。
這樣,即夢(mèng)會(huì)給我們做個(gè)裁剪,保留最適合申城豐富表情的部分。
看下效果:
這個(gè)表情豐富程度,真的是愛(ài)了,要比市面上其他同類(lèi)產(chǎn)品好太多了,尤其對(duì)于中文的支持,在我看來(lái)是處于當(dāng)下領(lǐng)先的地位。
視頻對(duì)口型的效果,同樣驚艷。
這里,我使用大圣的視頻,并采用文本驅(qū)動(dòng)的形式,生成了演示。
看看這個(gè)效果:
嘴型和內(nèi)容匹配程度非常的高了。
而且,在導(dǎo)入素材的時(shí)候,即夢(mèng)支持直接從資產(chǎn)選取,也就是可以從以往生成的圖片或者視頻中選擇。
這個(gè)流程就很絲滑了。
在即夢(mèng)中生成圖片,將圖片轉(zhuǎn)成視頻,再讓視頻人物開(kāi)口說(shuō)話,體驗(yàn)直接閉環(huán)了。
這個(gè)要給即夢(mèng)點(diǎn)個(gè)贊。
目前,每日發(fā)放積分,積分范圍內(nèi),等于免費(fèi)。
還不知道的,快去體驗(yàn)體驗(yàn)吧。
鏈接:https://jimeng./ai-tool/video/generate
好了,就介紹到這里。
我是曉來(lái),再會(huì)!