摘要:本發明公開了一種基于能量統計的語音音量自動調整方法。本發明包括如下步驟:(1)統計每幀采樣點的能量平均值energy和該幀中所有采樣點能量值的絕對值中的最大值峰值peak;(2)計算0到frame_index幀中每幀采樣點的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg;(3)計算下個時間段time內的放大因子factor_max′和縮小因子factor_min′;(4)對下個時間段time內的每幀語音數據進行判定,當需要縮放時,通過縮放因子進行放大或者縮??;(5)將處理好后的語音數據幀輸出,結束。本發明利用語音數據的相似性和持續性,根據前一段時間的語音數據統計信息,來預測下一段時間需要用到的放大因子和縮小因子,在滿足實用性的同時盡量降低算法的復雜度。
- 專利類型發明專利
- 申請人浙江萬朋網絡技術有限公司;
- 發明人松春鋒;
- 地址310013 浙江省杭州市文三西路118號電子商務大廈15樓
- 申請號CN201510109054.6
- 申請時間2015年03月12日
- 申請公布號CN104699447A
- 申請公布時間2015年06月10日
- 分類號G06F3/16(2006.01)I;