上海財經大學以開源框架為基礎,以私有云建設為核心,極大豐富和拓展了傳統文檔管理的內涵。
在當前國內高校的數字化建設中,文檔是其中非常重要的部分,包括各種辦公文檔、電子表格、教學資源課件、科研成果、課堂圖片影像等文檔資料在各高校的發展建設中至關重要。文檔數量與容量的快速增長,給傳統服務器帶來了挑戰。隨著云技術的發展,私有云存儲成為學校校園數字化建設中文檔管理的最佳選擇。它能夠有效控制數據及其安全性,可根據自己的需求特點,部署特定的安全策略,還能與學校的教學系統平臺等第三方資源進行整合。我們將該私有云存儲系統部署在安全數據托管中心,當學校師生訪問該資源時,不會受到網絡不穩定等因素的影響,能提供較高的服務質量。另外相對公有云而言成本較低,可免費給學校師生提供長期服務,在部署方式上也更為靈活,能更好地適應學?,F有的軟硬件架構體系。
校園網現有文檔管理現狀
上海財經大學現有院系及某些部門機構的文檔管理一般分兩種模式,一種即原始的通過FTP文件服務器進行管理,在安全管理及多用戶協作方面存在問題。另一種是部署SVN等服務器,可對文檔進行多版本管理和多用戶的協同操作,但是缺少在移動辦公、即時溝通、隨時分享等方面的功能,也不能根據學?,F有的組織架構進行分配,建立靈活的教學科研等項目小組。而且這種版本控制軟件比較專業,在使用規模上難以大規模推廣,很多教師學生需要一個直觀且容易使用的平臺,來滿足各種文檔管理的需要。
校園“云”協作總體構思方案
針對以上問題,我們在上海財經大學校園網文檔管理中設計了新的解決方案,提出私有云協作的概念。它是一個文件協作管理系統,通過整合組織架構和靈活的項目小組,給學校師生提供一個以文件為中心的工作學習協作平臺。
從圖1可以看出,我們設計的系統支持多類型終端,包括網頁、iOS與Android移動終端APP、PC客戶端和微信企業號。實現了任何時間、任何地點、任意終端的接入訪問。其中網頁主要提供文檔管理與查看、信息溝通和系統管理功能;PC客戶端提供了文件同步上傳和下載功能;移動終端APP提供文件查看和共享、信息溝通;微信企業號提供信息推送和文件瀏覽功能。上述文檔包含了所有歷史版本信息,哪個用戶什么時候修改的,相關用戶都能方便地進行查閱。
圖1 工作學習協作平臺
我們建設的私有云文檔協作系統整合了組織架構和項目小組的協作模型,提供了高效便捷的文件共享與工作協同。該系統本身提供了全方位的安全保障機制,數據的傳輸和存儲采用了高級數據加密技術,防止數據泄密。實現了多級細粒度權限控制,按需保護數據??梢暬奈臋n工作區權限依次分為:公共空間-我的院系部門-負責及參與的小組-個人空間等多種形態,幫助學校打造專屬的可控文檔管理中心。不同的院系部門和項目小組有自己獨立隔離的文件協作空間,可由各級指定負責人來管理上述每個工作區用戶的訪問權限。
如圖2所示,我們將私有云文檔協作系統按功能分成了五個模塊:File Management(文檔管理),File Sharing(文檔共享),File Collaboration(文檔協作),File synchroniztion(文檔同步)和System management(系統管理)。這五個核心功能模塊在上述四種客戶端中都有設計實現,但側重點不同,如網頁端側重全面整體的功能,移動端APP側重信息的瀏覽和分享等。
圖2 私有云文檔協作系統
1.文檔管理包括了文件上傳、文件下載、在線預覽、全文搜索、文件管理、版本控制等功能。其中版本控制會對系統中所有文檔進行版本管理,用戶可通過網頁端查看某文檔的所有歷史版本,包括每個版本號、修改人、修改時間,且可對每個版本進行預覽、下載和刪除操作。同時用戶也可通過PC端的文檔版本同步工具設置本地的一個同步文件夾,設置好自動同步的時間間隔,然后系統會自動將云端的所有文檔同步到本地,如果本地文檔有修改也會自動將本地文檔同步到云端,因此用戶只需在自己的電腦上對文檔進行維護,然后由版本同步工具自動同步,其他用戶就可在云端查看到該用戶對此文檔的修改。另外全文搜索具有索引引擎、查詢引擎、文本分析引擎、對外接口等,不僅可以搜索文檔中的內容,還能直接搜索圖片里的文字。我們采用了OCR文字識別,可通過字符識別方法將圖片中的正體文字翻譯成計算機文字,然后通過搜索引擎定位包含該文字的圖片。
2.文檔共享包括文件和文件夾的共享、部門及項目小組的共享、共享權限控制和外鏈分享等。其中文件共享是指用戶可通過網頁端和移動端APP共享文件,用戶可通過網頁端對文檔進行內部分享,即分享給系統中公共空間(所有用戶)或指定的部門和項目小組;而通過移動端APP,用戶則除了內部還可以進行外部分享,包括QQ、微信與郵件分享,可以很方便地將文檔分享給自己的同事、同學、好友。外鏈分享指分享人可通過外鏈方式,將私有云文檔協作系統中的文件進行對外文件分享,可對外鏈的有效期、訪問密碼及下載權限進行設置,同時也支持通過郵件分享該外鏈的URL。得到該外鏈的用戶通過訪問URL可得到下載的文檔和分享人信息,并可通過網頁或二維碼來進行下載。
3.文檔協作包括任務管理、即時消息發送、基于文件的討論、通知推送等。其中通知推送指協作項目團隊、部門和公共空間中的每個工作進展(包括文檔的添加更新和成員的更新)都會推送到移動端APP,以便相關用戶能第一時間掌握信息。同時考慮到微信的日益普及,上海財經大學微信企業號的師生用戶數已有16000多人,普及率超過95%,因此在設計本系統時將通知推送功能集成到了學校的微信企業號中,通過建立消息型應用和配置自定義菜單,在移動端APP收到的消息通過微信同樣能接收,方便部分沒有安裝APP的用戶及時獲取消息。即時消息發送指部門和項目小組成員可通過在組織內發送消息進行交流。文檔協作系統管理的對象是文檔,各個用戶可通過基于文件的討論,對指定文檔進行評論注釋,方便整個團隊的協作管理。另外任務管理中也可添加指定的文檔,設定任務的參與者與開始結束時間等,將工作任務分配給部門及項目小組成員,方便成員以任務的方式來管理維護文檔。
4.文檔同步包括實時和差量同步、斷點續傳和文件秒傳等功能。我們根據服務器上文件的MD5標識,只要存在相同文件內容,就可實現秒傳。不僅節約同步時間,也節省帶寬和存儲空間,因此在服務器端重復文件只保留一份。
5.系統后臺管理模塊包括組織架構管理、權限角色定義、空間配額配置、審計日志和系統回收站等。系統后臺管理主要由管理員在網頁端進行控制,由于我們的認證采用與現有AD認證服務器對接的方式,因此所有用戶的組織架構信息會自動從AD進行同步。系統管理員可以對部門和項目小組進行空間配額設置,各個權限角色的定義,日志的查看審計。
部署上,系統支持跨區域分布式云存儲和集群部署,在代碼層面實現了Node Manager和Metadata Manager,可通過系統配置靈活的增減系統的節點服務器,進行負載均衡,避免單點故障的發生。
校園“云”協作的整合擴展
面對大量非結構化文檔,為了方便用戶快速搜尋到相關文件的位置,在私有云協作系統中,整合了文本挖掘過程中的預處理分詞技術。在具體選用中,我們選擇了IKAnalyzer這個開源的基于Java開發的輕量級中文分詞工具包,它包括IK AnalyzerForLucene接口單元、IK Segmentation主分析器、詞元處理子單元、詞典配置管理模塊和擴展配置管理單元這幾個模塊。該工具包自帶的主詞典擁有27萬左右的漢語單詞量,且提供了通過API或IKAnalyzer.cfg.xml配置文件對詞典進行擴展,還可以配置自己的擴展停止詞字典,這樣某些不用解析的字就不會體現在分詞結果上。
實現流程如圖3所示,首先實例化一個IKAnalyzer分詞器,然后建立內存索引對象RAMDirectory,將配置寫入索引IndexWriter。在后續的搜索過程中需要實例化搜索器,最后用構造的Query對象在搜索器中進行搜尋,可依次搜索到相似度最高的指定條數的記錄。
圖3 搜索實現流程
我們還在該私有云文檔系統內部集成了對學校Blackboard教學軟件平臺的支持,該平臺是以課程為中心的網絡教學環境,在國際國內各高校有著廣泛的應用。通過擴展Blackboard的BuildingBlock,實現了校園教學網和文檔協作系統的整合??梢苑奖愕貙⑽臋n系統中的教學資源課件及課程視頻等文檔發布到教學網相關課程中;通過在BB中增加模板,也可將教學系統中的文檔同步到文檔協作系統中去。通過系統整合,既豐富了私有云文檔系統的內涵,又很好地提升了我校教學網中師生間、院系間和學科間的交流與協作功能,提升了學校教學信息化的整體水平,同時也方便了學校和院系加強教學質量監控。
我們在整合過程中使用了Building Block開發組件,該組件可實現Blackboard與外部系統的集成。它能作為課程和用戶工具集成到課程首頁和課程用戶工具面板中,也能作為系統管理員工具集成到系統管理員面板中。組件本身基于servlet,提供可擴展API,支持熱部署,可以方便地在當前系統增加集成功能。
Blackboard整合私有云文檔協作系統流程如圖4所示,首先在系統中增加了Blackboard基礎庫文件(bb-cms-admin.jar,bb-platform.jar和bb-taglibs.jar等)。隨后配置bb-manifest.xml,該文件是Building block的描述文件,配置接入的文檔協作系統名稱、整合頁面文件索引、組件類型等信息。在整合頁面中,我們添加了文件同步等功能,方便用戶操作。最后需導出該整合項目的jar包,由系統管理員在管理頁面中完成該jar包的安裝。
圖4 Blackboard整合私有云文檔協作系統流程
BuildingBlock組件還與外部系統間架設了橋連接,反過來也實現了通過調用Web服務在文檔協作系統中來引入Blackboard內容。
經過私有云文檔協作系統的建設和投入使用,學校人事處及科研處等職能部門與院系已經將文檔管理的任務放在了本系統中,通過配置文檔工作區權限,將部門及全校公開文檔分別設置,相關人員可方便地在自己空間中查詢到對應文檔,比之前單一通過文件服務器來管理的模式要方便有效得多。在本系統中我們已經整合了文本挖掘技術,整合了教學軟件平臺及移動微信企業號功能,之后將會把它進一步推廣成一個綜合的文檔協作管理平臺,所有的文檔都能在系統中進行操作和管理。學校師生如要查詢或打印文檔,查詢教學課件視頻或固定設備資產明細,閱讀相關制度規則等都可在本系統內完成,而不像之前各個分離的文檔信息孤島,要到特定系統中的某個位置才能查詢到指定文檔。
上海財經大學以開源框架為基礎,以私有云建設為核心,極大豐富和拓展了傳統文檔管理的內涵,在校園網絡環境下給學校師生提供了更便捷的文檔服務。
(文:陶晉 作者單位為上海財經大學教育技術中心)