德國Book2net非接觸式書刊掃描儀:中文古籍是中國的,是古老的;數字化是世界的,是年輕的。在信息技術不斷發展的今天,例用:非接觸式書刊掃描儀進行古籍數字化掃描加工的“聯姻”,為我國古籍的保護、整理與傳播帶來了十分喜人的形勢。我國中文古籍數字化掃描加工工程雖然起步比歐美國家晚,但是發展至今,目前無論在規模和水平上都已遠遠超過海外。這是記者從日前由首都師范大學電子文獻研究所主辦的第一屆中國古籍數字化掃描加工國際學術研討會上獲得的信息。
德國Book2net書非接觸式刊掃描儀:古籍數字化掃描加工是指采用現代化技術,對古籍文獻進行加工處理。具體而言就是借助計算機對古籍進行保護、整理、加工和傳播,將古籍通過數字代碼的形式存放。
會上,國內外專家普遍認為,古籍掃描儀是古籍整理和傳播的未來方向,是大勢所趨。數字化古籍以其信息量大、檢索快捷方便、不受時空限制等特質,使古籍使用者的效率大大提高。同時,古籍掃描儀也使許多難得一見的“鎮館之寶”得到新生,為廣大讀者閱覽我國古代文獻典籍提供了便利。
來自青海省文物考古研究所的張德芳說,這次會議讓他大開眼界,有些技術真是“聞所未聞,見所未見”。比如,擁有一部《四庫全書》不用再像過去一樣要給它建7座藏書閣,現在只需攜帶一個U盤就能帶著《四庫全書》走天下;更神奇的是,無論在何時何地,如果你有任何疑問,只要利用手機登陸專業網站,便可查詢、下載所需的典籍……
哈佛大學也在使用我國內地產品
據首都師范大學電子文獻研究所所長尹小林介紹,歐美、日本等國和我國港臺地區早在上世紀80年代初期就啟動了中文古籍數字化掃描加工工作,中國內地相對較晚,大約在90年代中期才陸續上馬,但發展迅猛,大有后來居上之勢,現在美國哈佛大學等一些國外知名高校都已開始使用由中國內地研發的數據庫。
目前,中國內地工作除古籍愛好者和研究者零星進行外,成規模的數字化工作基本上是由三種類型的機構來進行的:一是教學和研究機構,二是圖書館,另外還有商業機構。
例如,國家圖書館已經制定了一個龐大的古籍特藏文獻的數字化計劃,具體項目包括碑砧菁華、西夏碎金、敦煌遺珍、數字地方志以及甲骨文、《永樂大典》等,其中有些項目已經完成,并通過網絡為讀者提供服務,有的還在進行中。
北京書同文數字化技術有限公司于2000年研制完成了文淵閣《四庫全書》,這是古籍掃描儀進程中具有里程碑意義的一件大事,為古籍的數字化制作樹立了標本,積累了經驗。2001年,該公司又制作完成了《四部叢刊》的全文檢索版,收錄了1萬種古籍,可檢索,也可看到原圖。
1998年成立的北京愛如生公司是很有實力的古籍數字化專業公司,它制作完成的數字化古籍總數在3萬種以上。北京的國學公司推出的《國學寶典》,據悉其收錄的內容比《四庫全書》還要多出50%,該公司還從普及的角度推出了《國學備覽》等價廉物美的電子產品。
尹小林說,原來國外研發的一個《二十四史》的數據庫售價是8萬美元,屬于非常高檔的東西,但隨著國內古籍掃描儀工作的發展,這些產品的價格在不斷降低,為專家學者和國學愛好者帶來了實惠。
數字化后的新問題
任何事物在發展過程中總會遇到各種難題,同樣,古籍掃描儀工作目前確實也存在不少問題。“如生僻字不能錄入顯示,檢索程序的技術水平有待提高,符合理想標準的電子古籍還不多見,大型網絡古籍數據庫需要安裝專用的瀏覽軟件,不少大型古籍需要制作成電子文本等等。”南開大學教授楊琳說。
總結專家們的意見,記者感到目前問題比較集中的有以下幾點。一是古籍數字化掃描加工工作目前仍然缺乏一個統一的標準。比如,字形的問題。尹小林舉例說,在古代典籍中,一個字有很多種寫法,比如在對聯“氷冷酒,一點,兩點,三點; 丁香花,百頭,千頭,萬頭”中,“氷”即“冰”,可只有一點,如果在數字化的過程中,將其改寫成通用的“冰”字,就使原來的對聯缺少了韻味,也很難理解。再有,由于每家公司在制作時使用的格式和分辨率各不相同,在做數據交換的時候就遇到了困難,“這好比由于火車車廂、車軌寬度不同,很難實現火車對接。”尹小林說。
第二,目前一些古籍掃描儀工作還僅限于將古典文獻直接掃描,做成電子出版物,這只適用于保存,既不利于學者檢索,也不利于廣大青少年的閱讀和傳統文化的傳播。“掃描是必要的,但掃描只是數字化的預處理,是古籍掃描儀工作中很小的一部分。要想讓其利于傳播和檢索,大量的工作還是前期的考證、標引并將其變成簡體字進行新式排版等部分,這樣才能方便普通讀者閱讀,并讓其讀到真正精準的古籍作品。”尹小林說。
第三,由于缺乏全盤考慮和合理規劃,許多古籍掃描儀工作存在重復建設的情況。一些經典著作被不同的公司和機構看好,被分別收錄在不同的版本里,而一些不太被市場看好的典籍卻往往受冷遇,至今還“養在深閨人未識”。
第四,古籍數字化的真實再現,是建立在正確理解原文基礎上的文字轉化,這對人才儲備也提出了更高的要求。從業者必須是文理兼備的人才,既要掌握計算機技術,又必須有深厚的國學功底。據悉,北京大學信息技術管理專業碩士點已開始嘗試招收文科背景的學生,首師大電子文獻研究所也計劃招收古籍數字化方面的研究生。
專家們普遍認為,未來所有重要的古典文獻都將數字化,并將變成社會公用資源,無償使用。而同時,古籍數字化工作將永無止境,這是因為一方面每年都有新出土的古代文獻,另外今天的文獻也可能就是未來的古籍。例如,目前業內人士將大部分精力放在1912年以前的古典文獻上,而民國以來的文獻由于保存不力,很多文獻的紙張已經酸化,其數字化的工作已經被擺上了議事日程。因此專家們建議,當下一定要抓住國家已啟動全國古籍普查工作的契機,在普查調研結束后,應及時對其進行分類整理,并按照其價值高低,有序地將所有入選國家古籍名錄的典籍數字化。