一直以來,裝訂文獻要做到不失真和均勻照明地掃描是幾乎不可能的,在德國的 ‘斯圖加特’ 市的一個著名的科技小鎮‘Tübingen’,一家掃描儀專家“賽數”和在 ‘馬格德堡的’ 的一家“電子、信號處理和通訊技術所”的合作下,這個問題現在已成過去。一個名為‘Perfect Book’的創新軟硬技術已能夠完美地展平書本中縫和修正變形問題,該技術現在已經應用到新的“賽數”OS12000系列掃描儀上。
裝訂文獻的數字化存檔在圖書館和博物館變得日益重要。在過去,不拆書特別是掃描厚的書本,由于書脊做成頁面的彎曲,要影像完全不出現彎曲或變形幾乎是不可能的。由于表面彎曲引起的變形,做成信息在光學字符識別時產生較高錯誤率。
“賽數”和位于馬格德堡的“Otto von Guericke大學”內的“電子、信號處理和通訊技術所”就這個基本問題,雙方在其硬件和軟件的共同開發提出了解決方法。
長久以來在掃描儀技術領域中,對書本和文檔變形修正的方法不外是推斷頁面上光的分布或實際表面輪廓線或把頁面邊緣變直方式進行修正。用精確的數學運算和軟件來完全解決,使用“平直”和 “平滑”方式 ,將扭曲的線和文字校正。
“賽數公司”的“Orthoscan”也就是使用這種技術,這方法對于消除書脊弧面是非常有效的工具,但是在實踐中經常有其局限性。如果書本輪廓出現插入便條或頁面不完整或邊沿破損,做成展平困難,甚至不能展平。
早期插入便條或頁面損壞影響展平的質量和準確性
注 : 只有當書本的上下輪廓線條都能被充份確認,軟件和數學運算才可以對其進行精確的 修正和展平處理。
1 加 1 變成 3 = 3D
“Perfect Book” 是基于硬件和軟件相結合的方法,使用“賽數”12000系列掃描儀和“賽數”掃描軟件。“Perfect Book”的設計是基于立體視覺系統,在掃描過程中捕捉頁面3D輪廓。除了常用的高分辨率線陣掃描頭(圖示黃色部份)外,捕捉3D數據需要額外具有VGA分辨率(640 x 480像素)的標準USB數碼相機,其作用為表面或面陣模型式數碼相機(圖示綠色部分)。
兩個成像系統同時捕捉影像,不需要耗時的預掃,達到3D(3維)結構
來自線陣掃描的影像 來自面陣模形拍攝的影像
用線陣掃描產生一個可再生形式的影像。一條光帶以可再生速度與線陣掃描同步移動,在掃描時照亮原稿。移動光帶照亮的影像被一個固定面陣模型數碼相機以既定的幀頻將影像順序記錄。利用特殊的數學計算,從面陣拍攝的影像頻率可以重建掃描頁面的輪廓,并在第二階段轉變為一個平面。
從不同角度同時用兩個校準的成像系統,可達到高質量的修正,“Perfect Book”成功克服對純數學方法在模糊或書邊破損時帶來的誤差和影響。線陣掃描和面陣拍攝雙組合,在掃描平臺上產生虛擬的書本表面3D模型,從既定的坐標系統計算3D表面的等高線作為整個系統的校準。
由於使用真的3D數據,“Perfect Book” 不需再只依靠頁邊來確定位置和格式。頁的識別是基于書本右頁面、左頁面和兩頁之間的高度。當高度數據出現不等同時,自動加入結構性分析確定頁邊。因此書本能自然地打開,操作不但更容易,省時和更能保護書本。 “Perfect Book” 既能非常準確地分開書的兩頁,在需要打印時就能夠確保最佳打印質量和效果。
“Perfect Book” 自動修正出現在朝向書中縫字符所產生的變形和自動識別頁面的大小。

Orthoscan 效果 Perfect Book 效果
結果是靠近書中縫變形的字符在掃描過程中被直接正確地排列成直線,頁與頁自動正確地分離。軟件更使靠近書中縫變形的字符變得平直和平整,字與字之間更平均,消除中縫陰影等。即使字符是隱藏在書中縫也能捕捉清楚無遺。
除了得到高質量打印的好處外, ‘Perfect Book’ 功能清除了書本中縫和邊緣的陰影,達至打印時顯著節約墨粉。 對于用戶更可貴的是在將掃描的文字從影像轉換為文本格式時,OCR識別的錯誤率顯著減少,提高了工作效率。
在過去“賽數”已經在照明(曝光)概念上有過一次成功革命,現在獲得專利的‘LED’(發光二極管)照明技術提供更佳的光聚焦掃描,其結果是更高的處理速度和對操作員及被掃描物提供低于1 lux 小時的曝光量。
由于光聚焦和高能效,可得到更清晰、無干擾、真彩色的影像。防止陰影的發生和反射光的干涉因而盡量保證光照區朝向書中縫,正好用于有問題的文檔, 更何況“Perfect Book” 的面陣模型式相機是不需要額外光源的。
賽數案卷掃描儀為檢察院提供完美“perfectbook”掃描功能。