在全球網絡化的今天,檔案數字化圖書館的作用日益彰顯,公眾根據自己的需求,可借助通信設備隨時隨地在沒有圍墻的圖書館檢索和閱讀各類型資料,這其中就包括古籍文獻。古籍檔案數字化資源是數字圖書館資源的重要組成內容是由古籍掃描儀、書刊掃描儀、非接觸式書刊掃描儀共同完成的。中華古代典籍是中華民族記憶的載體,是民族智慧和文明成果的結晶,是祖先留給我們的寶貴精神財富。圖書館肩負傳承文明的歷史重擔,不但要保存保護好古籍,還要使其化身千百、服務社會。古籍檔案數字化服務能夠有效解決古籍保護和利用的矛盾,是傳承文明、服務社會最重要的方式之一。
國務院辦公廳頒布的《關于進一步加強古籍保護工作的意見》(國辦發[2007]6號)中明確指出要制定古籍檔案數字化標準,規范古籍檔案數字化工作,建立古籍數字資源庫。黨的十七屆六中全會提出,要“推進文化典籍資源數字化”。這是向圖書館古籍工作者提出的重要任務,是當前大力推進古籍數字化的有利契機。
一、古籍檔案數字化實踐成果
我國自上世紀80年代開始進行古籍檔案數字化加工工作,經過幾十年的探索與開發,取得了顯著成果。在現存約15萬個品種50萬個古籍版本中,目前已完成大約3萬個古籍品種的檔案數字化加工,超過20億字的全文文本格式及數千萬圖像格式,并形成了較為成熟的古籍檔案數字化技術和標準。
在書目數據庫方面,擁有古籍館藏的圖書收藏機構大部分都通過書籍掃描儀、非接觸式書刊掃描儀、全自動書刊掃描儀來建立了古籍書目數據庫,同時運用信息系統技術建立了眾多古籍聯合目錄數據庫。在全文數據庫方面,也涌現了大量古籍檔案數字化成果,較有代表性的包括:國家圖書館古籍檔案數字化資源庫,北京大學檔案數字化圖書館古文獻資源庫,上海圖書館館藏善本古籍、家譜全文影像數據庫,大學數字圖書館國際合作計劃(CADAL),文淵閣《四庫全書》電子版,中國基本古籍庫等等。
國家圖書館是國內最早開展古籍檔案數字化的圖書館之一,采用非接觸式書刊掃描儀、書刊掃描儀、古籍掃描儀的掃描方式開展了古籍檔案數字化工作,包括原件的檔案數字化加,縮微設備數字化,國際合作海外古籍文獻檔案數字化等??傆嫾s3萬余種。
國內大陸以外,港臺地區以及漢文古籍收藏較多的英國、美國、日本等國在中文古籍檔案數字化加工上都取得了一些頗有影響的成果。
二、古籍檔案數字化建設面臨的主要問題
我國的古籍檔案數字化雖然取得了一定的成績,但問題仍然凸顯,還存在著一些問題有待解決,主要表現在:
(一)缺乏統一規劃,重復建設嚴重
我國古籍數量龐大,且分散收藏各地。各收藏單位根據自身業務建設需要進行規劃和開發館藏檔案數字化的工作。從全國古籍檔案數字化掃描加工工作來看,基本處于一種缺乏宏觀管理和調控的狀態。文淵閣《四庫全書》至少已有三家進行過影像的數字化(上海人民出版社與迪志文化出版有限公司的光盤版,武漢大學出版社的光盤版,“中美百萬冊書數字圖書館”的網絡版等),一家進行了影像全文文本的數字化(上海人民出版社與迪志文化出版有限公司的網絡版)。二十五史數字版本就更多,造成了人力、財力、物力的浪費。
(二)缺乏統一標準,阻礙資源共享
就我國現已完成的古籍檔案數字化成果來看,由于最初采取的往往是封閉式建設模式,各單位在著錄格式、數據格式、文字編碼等方面均存在差異。
在著錄格式上,國家圖書館編寫了《漢語文古籍機讀目錄格式使用手冊》,并且按照MARC格式著錄館藏古籍, 有些圖書館采用的是都柏林核心元數據集DC數據格式進行古籍著錄,還有不少圖書館是運用自己的方式著錄古籍。著錄格式的不統一,使得各館編目數據的交換困難重重, 即使借助一定的軟件依然需要很多的人工干預,非常不利于今后古籍資源的共建共享。
由于信息技術的快速發展和商業機構發展利益的需要,古籍數字化對象數據格式在選擇上也面臨繁多和復雜的局面,這其中有國際標準、事實標準,也有商業標準。
古籍著錄大部分采用繁體字著錄,但也有采用簡體字著錄的。由于選擇字庫不同,使得數據的交換無法直接進行,而只能通過專門的軟件作為中介,進行格式和文字的統一。由于著錄標準上的差異,今后即便能將這些數據匯入統一的數據庫進行檢索或跨庫檢索,也會給讀者的使用帶來諸多不便,導致無法真正實現國家乃至世界范圍內的資源共享。
(三)缺乏經費支撐,區域發展不均
近年來包括國家圖書館、上海圖書館、北京大學圖書館、浙江大學CADAL管理中心等在內的古籍收藏機構已啟動了一批古籍數字化工程項目,憑借資金、資源、人才上的優勢,各自取得了十分顯著的成果。但大多數圖書館由于經費匱乏、技術力量薄弱,古籍數字化工作仍然比較落后,一般還停留在圖書掃描、部分普通書目數據庫建設等簡單數字化階段,還有一些公共圖書館這方面的工作至今尚未啟動。
(四)無統一發布平臺,不利用戶查詢
由于古籍數字化成果沒有統一的發布平臺,各單位、各系統按照自己的規則發布,存在光盤版、網絡版、局域網發布等多種方式,其中局域網發布又占了很大比例,因此雖然已有大量古籍數字化產品,但讀者能夠看到的卻不多。從國家古籍保護中心對全國圖書館進行的調研中發現,古籍書目數據庫大部分對外開放,而絕大部分圖書館的全文影像數字化產品只提供在館閱覽,不提供互聯網服務,用戶利用非常不便。
上述問題的存在,嚴重阻礙和制約了古籍數字化工作的深入開展。古籍數字化工作迫切需要統一規劃,統一標準,合作共建,資源共享。
三、中華古籍數字資源庫建設
中華古籍數字資源庫是中華古籍保護計劃的一個重要項目。在文化部領導下,國家古籍保護中心擬訂了“中華古籍數字資源庫建設方案”,計劃第一階段從入選《國家珍貴古籍名錄》的古籍入手開展數字化工作,再以此為基礎,進一步建立品種版本齊全的中華古籍數字資源庫。
(一)整體規劃
中華古籍數字資源庫由全國古籍保護工作部際聯席會議和文化部統籌規劃,國家古籍保護中心和各省級古籍保護中心組織全國古籍收藏單位共同合作實施。按照統一標準開展古籍數字化工作,建立全面反映中華古籍品種和版本的中華古籍聯合書目數據庫和古籍影像資源庫,包括漢文和少數民族古籍、甲骨文、簡帛古籍、敦煌遺書、碑帖拓本、輿圖等。
中華古籍數字資源庫第一階段的建設擬從《國家珍貴古籍名錄》入手,計劃在五年內完成一萬種國家級珍貴古籍元數據和影像數據的建庫工作。其次將范圍擴大到善本古籍,最后擴展到普通古籍,用20年左右時間完成大約15萬品種50萬版本的古籍數字化。
為積累操作流程、使用標準、發布方式等各方面經驗,擬選取基礎條件較好、入選《名錄》古籍較多的單位先行試點,為全面數字化打下基礎,從小到大,逐步展開。
(二)中華古籍數字資源庫的建設原則
1、統一規劃。
由全國古籍保護工作部際聯席會議單位和文化部統一領導,由國家古籍保護中心和各省級古籍保護中心負責組織實施。國家古籍保護中心負責整體規劃及前期各項工作,調研古籍數字化進展情況,編制古籍數字化工作手冊,擬定目錄,培訓人員,向省級古籍保護中心下達“中華古籍數字資源庫”建設任務書。根據任務完成情況,組織專家和技術人員驗收數字化成果,達到標準的正式發布,并支付相應費用;不達標的指導修改或重新制作,直至驗收合格。
2.統一標準。
古籍數字化標準的先行建設是古籍數字化建設成果長期保存和最大限度共享利用的保障。古籍數字化標準規范體系建設要以實現古籍資源的共建共享為基本目的,優先采用已經成熟的國際標準和通用規范,認真貫徹國家標準和行業標準。建立全國統一標準,包括元數據著錄標準、數字化影像標準、資源格式標準、資源標引標準、數字化古籍長期保存和發布標準等。
在多年的數字化實踐中,陸續出臺了一些相關標準。如《古籍著錄規則》、《古籍描述元數據著錄規則》、《漢語文機讀目錄格式使用手冊》等等。目前大部分古籍數字化標準規范已經研發完成,可直接參照執行。國家古籍保護中心目前已組織人員編制“古籍數字化手冊”,對即將開展的古籍數字化工作進行規范。
3.合作共建。
中華古籍數字資源庫擬采用集中檢索、分布建設管理模式。數據擬借助數字圖書館工程的平臺發布,實現元數據和影像數據的集中檢索和管理。
全國古籍收藏單位分工協作,按照國家古籍保護中心擬定的數字化目錄和標準,在省級古籍保護中心領導下開展古籍數字化工作。
各省級古籍保護中心領導所屬藏書單位開展古籍數字化工作,建成的數字影像資源存儲在藏書單位的服務器上進行管理,同時建立統一接口,將古籍數字影像資源與中華古籍數字資源庫元數據進行關聯。古籍數字化應利用各藏書單位已經數字化并符合項目標準的成果,不搞重復建設,保證各自權益,從而實現中華古籍數字資源的合作共建。
4.資源共享。
古籍檔案數字化加工成果的服務利用,要按照國家古籍保護中心制訂的基本要求,一般為公益性免費向社會開放,提供讀者檢索、閱覽、研究、利用。從事研究工作的讀者在獲得授權許可、簽注保證書的前提下,可以下載影像數據。未經收藏館授權,不得進行商業開發、出版、銷售和數字發布。商業開發、出版、銷售和數字發布,應與收藏單位另行簽署協議。
(三)中華古籍數字資源庫建設第一階段任務
我國現存古籍數量龐大。“中華古籍數字資源庫”第一階段擬先從《國家珍貴古籍名錄》入手,逐步實現我國所有古籍品種和版本的數字化?!秶艺滟F古籍名錄》是文化部組織評審、國務院公布的國家珍貴古籍目錄,從《古籍定級標準》中規定的一、二級古籍中遴選產生。2007年至今,已評選出四批共11380部珍貴古籍,其中國務院已公布三批9859部,第四批上報國務院1521部待批準,其數量規模幾乎是《中華再造善本》及續編1367種的10倍,是我國最珍貴的典籍文化遺產。對《國家珍貴古籍名錄》中的珍貴古籍進行數字化,能更加全面的反映古籍的真實面貌,有利于學界對珍貴古籍的研究利用,是造福全民的大工程。國家古籍保護中心將協同各省級古籍保護中心,組織全國古籍收藏單位共同合作,將已入選《國家珍貴古籍名錄》的古籍進行數字化。
1、摸清現狀,擬定目錄。
《國家珍貴古籍名錄》入選古籍往往存在一種書入選若干相同版本的情況,進行數字化應精選最優版本。入選古籍的類別多種多樣,包含甲骨、簡帛、敦煌遺書、佛經、碑帖、漢文古籍和少數民族文字古籍,以及少量外文古籍。其中有些已經進行了數字化,有些暫時不宜實施數字化,需要區分輕重緩急,分批開展。因此,首先要調研現已完成的珍貴古籍數字化情況,組織專家擬定古籍數字化的階段性目錄。
2、檔案數字化制作。
按照選定的古籍檔案數字化目錄,依據數字化相關標準,由古籍收藏單位進行數字化制作,包括拍照掃描前的整理、拍照掃描及標引工作等等。制作完成后由國家古籍保護中心組織驗收,驗收合格后上網發布。如某單位不具備數字化制作條件,可委托其上級主管單位代為制作和數據處理。省級古籍保護中心應充分發揮協調、管理作用,組織本省開展此項工作。
各位同仁,古籍數字化是古籍保存、整理和利用的必然趨勢,也是數字圖書館建設的重要組成部分,目標是通過統籌規劃,共同建設,使所有古籍數字化成果在最大范圍提供服務利用,真正實現古籍資源的共建共享。讓我們大家攜手合作,共同努力,早日實現這一宏偉藍圖。
賽數高精度書刊古籍掃描儀OS14000TT
主要參數:
u 掃描儀類型:A2 彩色掃描儀
u 掃描儀描述:頂置式雙掃描頭,臺式非接觸掃描,適合文物、古籍、圖書、報紙、字畫、地圖等單頁或裝訂成冊稿件
u 原件尺寸:635×460 毫米(超A2)
u 掃描速度:3.5秒/頁(A2,彩色,300dpi)
4.0秒/頁(A2,彩色,400dpi)
6.0秒/頁(A2,彩色,600dpi)
u 分辨率:600dpi
u 掃描模式:線性CCD逐行掃描,36位彩色線性CCD輸入,24位輸出;12位灰度和1位黑白二值輸出
u 原稿厚度:書本最大厚度為150毫米
u 掃描稿臺:連機書稿臺,90 度開合電動壓稿玻璃
u 掃描方式:高解析度,高精度的掃描鏡頭,8線對/毫米,不失真,景深達50毫米/2英寸。采用雙鏡頭成像原理,同時捕捉平面及立體影像。自后向前掃描。
u 影像傳輸接口:雙IEEE1394 火線接口
u 光源:即掃即亮LED冷光源,無uv/IR輻射,極強的抗外界光源干擾能力。
u 影像格式:TIFF 不壓縮,TIFF G4,JPEG,JP2,PDF,多頁TIFF,BNMP,PCS
u OS12掃描軟件基本模塊:掃描、存儲、瀏覽,同時輸出黑白、彩色、灰度
u 掃描原理:雙鏡頭成像原理,雙成像系統,同時采用線形CCD掃描和旋轉成像,同時為避免莫爾條紋干涉采用自后向前的掃描方式,線形CCD獲得掃描面平面影像,3D攝像獲得書本的三維影像,硬件將兩個影像疊加組合,非常方便的實現自動糾偏、中縫兩側文字和線條的變形校正、自動書脊彎曲校正、自動識別書本輪廓、自動分頁自動去除手指影像。特別適合不拆的書刊和檔案資料。
u設備采用內置PC方式,也可以直接連接電腦
u可選配V型掃描稿臺附件