摘要:本發明涉及語音識別技術領域,特別涉及一種將語音數據轉換為文本文件的方法和系統。所述方法包括:開始采集語音數據,將語音數據轉換為文本文字;提取出第一份音色數據,標記所述音色數據并儲存;將文本文字儲存為對應所述已標記的音色數據的文本文件;從預設的信號采集時間間隔內采集的語音數據中提取出音色數據,并將所述音色數據與已標記的所有音色數據逐一進行對比;如果音色數據相同,則將轉換成的文本文字儲存至與所述已標記的音色數據對應的文本文件;如果音色數據不同,則標記所述音色數據并儲存,將轉換成的文本文字儲存為對應所述音色數據的另一文本文件。本發明能區分不同發言人的發言內容,簡化了錄音后的人工整理工作,省時省力。
- 專利類型發明專利
- 申請人廣東威創視訊科技股份有限公司;
- 發明人劉觀發;
- 地址510663 廣東省廣州市廣州高新技術產業開發區彩頻路6號
- 申請號CN201110436096.2
- 申請時間2011年12月22日
- 申請公布號CN102522084A
- 申請公布時間2012年06月27日
- 分類號G10L15/26(2006.01)I;G10L15/08(2006.01)I;