摘要:本發明提供一種構建領域本體的方法,包括步驟:1)選取種子領域術語,建立領域本體,并設定種子領域術語的信息具化度;2)根據種子領域術語抽取領域術語,并根據種子領域術語的信息具化度計算領域術語的信息具化度;3)將領域術語按照其信息具化度排列,計算當前領域術語和領域本體中任一領域術語的相似度;4)根據信息具化度和相似度選擇當前領域術語的可能的關聯術語;5)在語料庫中驗證當前領域術語與其可能的關聯術語之間可能存在的關系模式的可信度,如果可信,則將當前領域術語加入領域本體,否則,刪除當前領域術語;6)重復步驟3)、4)和5),直到所有領域術語均已經加入領域本體或被刪除。由此,更加準確有效地建立領域本體。
- 專利類型發明專利
- 申請人北京億維訊科技有限公司;
- 發明人趙琦;高建忠;黃毓瑜;焦希泉;
- 地址100026 北京市朝陽區西大望路甲1號溫特萊中心A座5A層
- 申請號CN200910243990.0
- 申請時間2009年12月30日
- 申請公布號CN102117281B
- 申請公布時間2013年05月08日
- 分類號G06F17/30(2006.01)I;