摘要:一種基于實時解碼的語音端點檢測方法,步驟為:輸入語音識別相關文本,解析文本;根據文本解析結果構建解碼網絡;輸入語音,提取語音中的聲學特征,基于構建的解碼網絡對所述聲學特征進行解碼,得到解碼后的語音單元序列;對解碼后的語音單元序列進行語音端點判斷,判斷是否是語音端點,所述語音端點分為語音開始點和語音結束點;如果判斷結果是語音結束點,則把語音結束點信息反饋給外部外部應用系統,否則繼續第二步;在第三步中語音開始點判斷是可選的,如果外部外部應用系統不關心語音開始點,則不判斷語音開始點。本發明解決了在語音識別文本確定的情況下,傳統端點檢測技術表現出來的實時性不高,無法對用戶關心的語音進行針對性檢測問題。
- 專利類型發明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發明人吳玲;王兵;趙乾;潘頌聲;何春江;朱群;
- 地址230088 安徽省合肥市高新開發區望江西路666號
- 申請號CN201210483046.4
- 申請時間2012年11月24日
- 申請公布號CN102982811B
- 申請公布時間2015年01月14日
- 分類號G10L25/87(2013.01)I;