摘要:本發明公開了一種文本字符編碼方式的識別方法及系統,屬于字符編碼技術領域。所述識別方法包括:將待識別文本按照已知的N種字符編碼方式分別進行解碼,得到解碼后的每種字符編碼方式所對應的字符串;N≥2;根據解碼后的字符串中每個字符的出現概率計算每種字符編碼方式所對應的字符串的出現概率,將出現概率最高的字符串所對應的字符編碼方式確定為待識別文本的字符編碼方式。本發明的文本字符編碼方式的識別方法及系統,有效提高了字符編碼方式識別的準確性,尤其適用于短文本的字符編碼方式的識別。
- 專利類型發明專利
- 申請人明博教育科技有限公司;
- 發明人段垚;
- 地址100085 北京市海淀區上地三街9號嘉華大廈C座801-803
- 申請號CN201510107921.2
- 申請時間2015年03月12日
- 申請公布號CN104750666A
- 申請公布時間2015年07月01日
- 分類號G06F17/22(2006.01)I;