摘要:本發明公開了一種待譯文檔的預處理方法,包括:統計所述待譯文檔包括的行業類別屬性的數量和所述待譯文檔的實義詞密度;分別判斷所述待譯文檔包括的行業類別屬性的數量相對于行業類別屬性設定閾值的大小、所述待譯文檔的實義詞密度相對于實義詞密度設定閾值的大小,根據所述待譯文檔的實義詞密度相對于實義詞密度設定閾值的大小匹配所述待譯文檔的翻譯難度系數;根據這兩種判斷結果選擇將所述待譯文檔按所述行業類別屬性或者所述待譯文檔的翻譯難度系數拆分。本發明通過對待譯文檔進行合理的預處理,將待譯文檔分配給譯員翻譯之前進行判斷選擇最合適的拆分方式,使待譯文檔能夠匹配到最適合的譯員,加快翻譯待譯文檔的速度。
- 專利類型發明專利
- 申請人傳神聯合(北京)信息技術有限公司;
- 發明人江潮;
- 地址100022 北京市朝陽區東三環中路39號建外SOHO18號樓17層
- 申請號CN201310745397.2
- 申請時間2013年12月30日
- 申請公布號CN103714051A
- 申請公布時間2014年04月09日
- 分類號G06F17/27(2006.01)I;