男女聲特點(diǎn)
(此部分轉(zhuǎn)載自https://blog.csdn.net/u011389706/article/details/78965233)
- 男女聲基本區(qū)別
男女聲主要區(qū)別在于男女聲基音頻率(pitch frequency)的高低。一般女聲的音調(diào)比男聲的音調(diào)高,這種不同主要是反應(yīng)在基音頻率(pitch frequency)上。  一般女聲的基音頻率高于男聲,常見(jiàn)的男女聲基音頻率大致分布范圍如下圖所示。提取基音頻率比較常用的方法就是倒譜(cepstrum)。  聲音信號(hào)具有短時(shí)平穩(wěn)性,我們認(rèn)為在10~50ms的數(shù)據(jù)長(zhǎng)度上聲音信號(hào)是平穩(wěn)信號(hào),所以可以分幀然后用平穩(wěn)信號(hào)的處理方法進(jìn)行處理。首先就是分幀操作(這里取40ms幀長(zhǎng),20ms幀移),加窗后求倒譜,根據(jù)倒譜便可以求解出基音頻率。整個(gè)系統(tǒng)流程圖如下: 
GMM模型簡(jiǎn)介
GMM模型定義  詳細(xì)內(nèi)容有專(zhuān)門(mén)博客。
基于GMM語(yǔ)音轉(zhuǎn)換
1.基本原理  2.方法框架圖  3.特征參數(shù)提取,利用world聲碼器 
實(shí)驗(yàn)及分析
1.數(shù)據(jù)準(zhǔn)備  2.參數(shù)設(shè)置  設(shè)置合適的F0搜索范圍,能夠有效減少后續(xù)轉(zhuǎn)換時(shí)F0提取錯(cuò)誤,如半F0、雙F0的情況。  設(shè)置合適的歸一化功率門(mén)限值,可有效去除靜音幀,從而提升時(shí)間對(duì)齊準(zhǔn)確率。  3. 實(shí)驗(yàn)結(jié)果   
|