摘要:本發明公開了一種文本分詞方法及系統,所述方法包括:預先建立與待處理文本相對應的綁定詞典,并綁定所述文本和所述綁定詞典,所述綁定詞典中的詞包括所述文本中未收錄在通用詞典中的未登錄詞;將所述文本與所述通用詞典中的詞進行匹配,得到準分詞結果;根據所述綁定詞典中的詞對所述準分詞結果進行修正。采用本發明所述的文本分詞方法及系統,通過增加綁定詞典,為實現給不同的文本定制相應的詞典資源提供了很大的自由度,在不需要修改通用詞典情況下,實現文本分析結果的優化。
- 專利類型發明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發明人葉琿;王培養;郜靜文;高毅;于振華;趙志偉;
- 地址230088 安徽省合肥市高新開發區望江西路666號
- 申請號CN201410153908.6
- 申請時間2014年04月16日
- 申請公布號CN103942190A
- 申請公布時間2014年07月23日
- 分類號G06F17/27(2006.01)I;