摘要:本發明涉及基于聲學統計模型的單元挑選語音合成方法,其方法包括提取訓練語料庫各聲學特征;結合訓練語料庫中各句話的音段、韻律等標注信息,訓練各種聲學特征所對應的統計模型,在合成時通過對輸入文本進行文本分析,得到待合成句子中各音素對應的各種聲學特征的統計模型。以備選單元序列包含的聲學參數相對于待合成句的聲學統計模型具有最大的似然值為準則,搜索最優的備選單元;使用聲學統計模型間的KLD來實現合成單元的快速預挑選;最終通過對各個音素的最優備選單元的波形進行平滑和拼接,得到該句話的合成語音。本發明提高合成語音音質;同時提高傳統拼接合成方法的合成效果,并且可以實現系統的自動構建和語種的無關性。
- 專利類型發明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發明人凌震華;胡郁;胡國平;吳曉如;劉慶峰;王仁華;
- 地址230088 安徽省合肥市高新區黃山路616號信息產業基地
- 申請號CN200710191078.6
- 申請時間2007年12月06日
- 申請公布號CN101178896B
- 申請公布時間2012年03月28日
- 分類號G10L13/02(2006.01)I;G10L13/06(2006.01)I;G10L13/08(2006.01)I;