隨著新媒體的發展,報紙行業受到了多方面沖擊,甚至導致諸如《法蘭克福論壇報》和《紐倫堡晚報》這樣具有影響力的報社相繼倒閉。但今天的新聞就是明天的歷史,報紙檔案反映了社會方方面面的真實情況,它具有社會性、歷史性、確定性和原始記錄性等特性,能夠彌補檔案史料缺乏完整時間線索的不足,豐富史料內容,因此絕不能將其束之高閣,湮沒于塵埃之中,將報紙進行數字化迫在眉睫。讓我們首先來了解下大英圖書館是怎么樣保存和利用報紙檔案的吧!
大英圖書館收藏包括什么?
從十九世紀初開始,英國報紙出版業的規模巨大,許多城市和城鎮分別針對不同社會地位、地理位置和政治關系的受眾,同時出版了數家報紙。大英圖書館收錄了1800年以來英國發行的大部分報紙,這些收藏品的品質在世界上首屈一指。
那么大英圖書館是如何對原始報紙展開數字化并提供在線獲取的呢?
在過去的幾年里,他們團隊每天掃描原始裝訂的報紙頁面以及縮微膠片,制成數以千計的數字圖像。為了形成可供利用的數字檔案,掃描的頁面圖片會轉化JPEG2000格式,這些圖片文件也會通過光符識別(OCR)形成電子文本。這個過程包括將每張圖片分解成不同分區以幫助檢索,最后,在一個很大的數據庫中,會以輸出的光符識別(OCR)文本為基礎編制索引。
由于獲取了這些原始且已裝訂成冊,珍貴又脆弱的報紙,大英圖書館數字化掃描并提供在線檢索和利用成為可能。
將有價值的文獻資料數字化,使其不再受版權保護,是實現這些目標的關鍵措施。目前大英圖書館正在采用賽數掃描技術將其有價值的書籍、手稿和報刊進行數字化。在圖書館的數字化中心,22臺賽數掃描儀被用于謹慎且高效地對館藏文獻進行數字化掃描。該中心有22臺賽數非接觸式掃描儀,它們“支持最大600 dpi光學分辨率的圖像質量和最大A0的幅面”,大英圖書館負責人如此說。