摘要:本發明適用于計算機檢索技術領域,提供了一種關鍵字檢索方法、裝置及系統,所述方法包括:接收輸入的關鍵字檢索請求,請求中包括目標文件的ID和關鍵字檢索語句;根據目標文件的ID讀取文件信息;對目標文件進行分塊;在各分塊上運行Mapper程序,以由Mapper程序根據關鍵字檢索語句以及文件信息查詢得到各分塊對應的SCKS、SLCA節點,并生成子樹SCKS’;發送SLCA節點與SCKS’至Reduce設備,以由Reduce設備根據SLCA節點與SCKS’計算得到檢索結果。本發明,通過MapReduce對海量XML文件進行分布式并行運算,從而可以支持大數據量的關鍵字檢索。
- 專利類型發明專利
- 申請人中安消技術有限公司;
- 發明人徐光劍;
- 地址100190 北京市海淀區科學院南路2號融科資訊中心C座北樓17層12-13
- 申請號CN201310503091.6
- 申請時間2013年10月23日
- 申請公布號CN103544281A
- 申請公布時間2014年01月29日
- 分類號G06F17/30(2006.01)I;