摘要:本發明公開了一種利用二次語義標注的文本信息提取方法,包括如下步驟:步驟1,根據待處理文本中的任務需求,建立任務語義詞典;步驟2,利用預存的通用語義詞典對待處理文本進行第一次語義標注;步驟3,利用任務語義詞典對第一次語義標注后的文本進行第二次語義標注;步驟4,對經過第二次語義標注的文本利用基于語義的子語言語法進行解析以及信息提取,所述信息為任務所需的概念及概念所對應的關系。本發明方法克服了現有大規模語義詞典覆蓋性低,同時語義標記不能服務于特定子語言語法的問題,對于在中文環境下建立具有任務適應性的信息提取提供了更好的解決方案。
- 專利類型發明專利
- 申請人浙江大學;
- 發明人段會龍;李昊旻;張寅升;葛彩霞;
- 地址310027 浙江省杭州市西湖區浙大路38號
- 申請號CN201410021389.8
- 申請時間2014年01月17日
- 申請公布號CN103810156B
- 申請公布時間2017年01月18日
- 分類號G06F17/27(2006.01)I;