摘要:本發明是有關一種詞語聯想方法及裝置,涉及信息處理領域,方法包括:獲取文檔集合,所述文檔集合中包含至少一個文檔;將所述文檔中的語句進行分詞處理,得到至少一個詞語信息;對每個所述詞語信息進行分析,得到所述詞語信息的分析信息,將所述詞語信息以及所述分析信息保存;從所述保存的詞語信息中選出目標詞語,計算所述目標詞語的TF-IDF;計算除所述目標詞語外其他詞語的TF-IDF;循環所述目標詞語外其他所有詞語,計算其他所有詞語與所述目標詞語的關聯度;依據所述關聯度,將排名前N的詞語作為與所述目標詞組相關的詞組。本發明公開基于TF-IDF的詞語聯想分析方法,可以從給定文檔集合中挖掘出與目標詞語最相關詞語。
- 專利類型發明專利
- 申請人科大訊飛股份有限公司;
- 發明人易中華;徐波;汪磊;
- 地址230088 安徽省合肥市高新開發區望江西路666號
- 申請號CN201410673771.7
- 申請時間2014年11月21日
- 申請公布號CN105677633A
- 申請公布時間2016年06月15日
- 分類號G06F17/27(2006.01)I;