摘要:本發明涉及句子層面的大規??焖倨ヅ浞椒?,本方法包括索引建立、模糊匹配和精確匹配三個階段。索引建立階段進行句子內容的標準化、編碼轉換;模糊匹配階段的目的是從海量句子中挑選出可能與新句子匹配的候選句子,其數量控制在一個可行的范圍內;精確匹配階段采用了基于編輯距離的相似性衡量算法,再根據精確匹配的相似性對候選句子排序得到最終匹配的句子。本發明方法的優點是實際測試性能優異,搜索效率高、漏檢率低,滿足實用要求。
- 專利類型發明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發明人陳志剛;胡國平;胡郁;劉慶峰;王仁華;
- 地址230088安徽省合肥市高新區黃山路616號信息產業基地
- 申請號CN200810107117.4
- 申請時間2008年07月17日
- 申請公布號CN101329680A
- 申請公布時間2008年12月24日
- 分類號G06F17/30(2006.01);