摘要:本發明提供了一種語音指令數據獲取方法及裝置,屬于語音識別技術領域,該語音指令數據獲取方法包括:將接收到的音頻數據進行分幀處理;判斷當前幀的有效值是否大于預設的靜音閾值,若是,更新預設的時間變量,當所更新后的時間變量是否超過第一預設時間且下一幀的有效值是大于所述靜音閾值時,將所述下一幀標記為音頻指令數據起點;在音頻指令數據起點與第二預設時間之間的時間段內,查找第一個有效值位于預設范圍內的音頻數據幀,從而確定音頻指令數據終點;截取所標記的音頻指令數據起點至音頻指令數據終點的音頻數據獲得音頻指令數據。相對于現有的語音端點檢測方法,本發明提供的語音指令數據獲取方法簡單易行,計算量較小。
- 專利類型發明專利
- 申請人江蘇時間環三維科技有限公司;
- 發明人周子欞;
- 地址226000 江蘇省南通市港閘區深南路99號天安數碼城8號樓402-408室
- 申請號CN201610143886.4
- 申請時間2016年03月14日
- 申請公布號CN105825870A
- 申請公布時間2016年08月03日
- 分類號G10L25/78(2013.01)I;G10L15/22(2006.01)I;G10L15/04(2013.01)I;