摘要:本發明公開了一種基于深度神經網絡后驗概率算法的口語發音評測方法,包括:步驟一:將語音按幀提取為音頻特征向量序列;步驟二:將音頻特征輸入事先訓練好的模型和口語評測文本、相應單詞發音字典,確定音素狀態的時間邊界,該模型為DNN+HMM模型;步驟三:在確定時間邊界后,提取時間邊界內所有幀,按語音幀的幀長取平均值,作為該音素狀態的后驗概率,并得到基于音素狀態后驗的單詞后驗得分,單詞的后驗得分則為其所含的音素狀態后驗得分的平均值。
- 專利類型發明專利
- 申請人蘇州馳聲信息科技有限公司;
- 發明人惠寅華;王歡良;楊嵩;代大明;袁軍峰;林遠東;
- 地址215000 江蘇省蘇州市工業園區創意產業園9幢702室
- 申請號CN201410840991.4
- 申請時間2014年12月30日
- 申請公布號CN104575490A
- 申請公布時間2015年04月29日
- 分類號G10L15/00(2013.01)I;G10L15/06(2013.01)I;G10L15/14(2006.01)I;G10L25/69(2013.01)I;