摘要:本發明公開了一種基于深度學習的誤發音檢測方法和裝置,方法包括:步驟1)通過朗讀音頻提取聲學特征,通過朗讀文本和相應的單詞發音字典構建音素級解碼網絡;步驟2)結合聲學特征和預先訓練好的聲學模型對音素級解碼網絡進行解碼確定待檢測音素的邊界;基于由深度神經網絡構成的深度自動編碼器,根據音素的邊界和邊界內的聲學特征提取音素級特征,所述深度神經網絡為一深度貝葉斯置信網絡;將待檢測音素的音素級特征送入事先訓練好的發音正誤分類器,判斷待檢測音素的發音正誤。
- 專利類型發明專利
- 申請人蘇州馳聲信息科技有限公司;
- 發明人惠寅華;王歡良;楊嵩;黃正偉;方敏;袁軍峰;戚自力;
- 地址215000 江蘇省蘇州市工業園區星湖街328號創意產業園9-902單元
- 申請號CN201610662367.9
- 申請時間2016年08月12日
- 申請公布號CN106297828A
- 申請公布時間2017年01月04日
- 分類號G10L25/78(2013.01)I;