摘要:本發明公開了一種具有語音控制和哼唱檢索功能的多媒體播放方法及裝置,方法步驟如下:用戶選擇工作模式,采集語音數據并預處理,語音控制模式下,將語音數據與語法規則上傳至語音識別服務端進行語音識別,根據識別結果進行播放控制或者資源管理;哼唱檢索模式下,將語音數據提取基音序列并轉換為音符序列,通過匹配搜索服務端找到與匹配的多媒體資源身份信息,并下載對應的多媒體資源到本地;裝置包括人機交互模塊、語音輸入模塊、語音數據處理模塊、中央處理器、媒體存儲模塊、播放解碼模塊、音頻輸出模塊、網絡接口模塊、匹配搜索服務端等。本發明具有能夠解放用戶的雙手、用戶體驗好、使用方便、哼唱檢測精確、應用范圍廣的優點。
- 專利類型發明專利
- 申請人湖南大學;
- 發明人趙歡;
- 地址410082 湖南省長沙市河西岳麓山湖南大學信息科學與工程學院
- 申請號CN201310298771.9
- 申請時間2013年07月16日
- 申請公布號CN103366784A
- 申請公布時間2013年10月23日
- 分類號G11B27/10(2006.01)I;G10L15/30(2013.01)I;