摘要:本發明公開了一種西文單詞中字符大小寫的修正方法和裝置,屬于文字處理領域。方法包括以下步驟:獲取目標文本的字符的識別結果和字符在圖像中的位置;根據字符的識別結果和在圖像中的位置判斷字符的基線屬性,經統計后確定單詞的基線信息;根據單詞的基線信息確定字符的基線屬性,將字符的基線屬性進行修正后輸出識別結果。本方法有效地處理了不符合一般書寫規范、或是無法簡單統計得到基線的單詞,對于單詞行出現扭曲情況下得到字符的基線屬性經統計后能夠有效處理判斷字符的大小寫,具有良好的自適應性,使單詞的識別率大大提高。
- 專利類型發明專利
- 申請人漢王科技股份有限公司;
- 發明人萬鑫;劉正珍;
- 地址100193 北京市海淀區東北旺西路8號5號樓三層
- 申請號CN201010160729.7
- 申請時間2010年04月26日
- 申請公布號CN102236638B
- 申請公布時間2014年11月19日
- 分類號G06F17/27(2006.01)I;