摘要:本發明公開了一種英文文獻關鍵短語自動抽取方法與系統,包括信息處理模塊、英文文本解析模塊、候選短語挖掘模塊、候選短語過濾模塊、候選短語排序模塊、同義短語歸一化模塊及關鍵短語選取模塊,英文文本解析模塊主要對縮略語還原后的文本數據進行文本解析,候選短語挖掘模塊主要對英文文本解析后的數據進行候選短語挖掘,候選短語排序模塊主要對過濾后的候選短語進行權值計算,并根據權值按照大小進行排序,同義短語歸一化模塊主要對相同含義的短語進行歸一化,關鍵短語選取模塊,主要用于根據權值輸出指定數目的關鍵短語。
- 專利類型發明專利
- 申請人同方知網(北京)技術有限公司;
- 發明人符文君;周海波;強成倉;馬娟;張振海;
- 地址100084 北京市海淀區清華園清華大學36區1410、1412、1414
- 申請號CN201610363382.3
- 申請時間2016年05月26日
- 申請公布號CN106066866A
- 申請公布時間2016年11月02日
- 分類號G06F17/30(2006.01)I;