案例單位:哈爾濱工業大學
1.引言
隨著“雙一流”戰略的提出,一流學科建設被提上大學日程。圖書館作為大學的文獻信息中心,為學校教學和科研服務,是學校信息服務體系的重要組成部分。那么,如何優化學科資源體系建設,則成為圖書館界重要的研究方向。
2.背景
高校學生的學習過程具有很強的自主性。圖書館電子信息資源由于方便快捷,不受時間等客觀因素的影響,已經成為學生近年來的主要學習方式。信息技術的發展,也使電子資源得到及時的更新。
3.目的
為了記錄用戶使用電子資源各種讀者行為,統計用戶所使用電子資源的信息,充分了解用戶對電子資源訪問情況,從海量數據中進行數據挖掘、學科統計和用戶畫像。為了便于圖書館電子資源的管理,幫助學校更好地達成“雙一流”建設目標,Polyinfo圖書館電子資源優化分析云系統由此產生。
4.內容
4.1整體設計架構
本系統使用分布式Hadoop數據庫存儲所有數據。采用私有云架構實現功能,分為三個部分:數據采集設備、數據云處理服務器、數據云存儲服務器。采集設備為獨立硬件,通過分光或者鏡像的方式,將校園內各區域的流量接入到采集設備,分別進行采集。數據處理服務器主要是將采集服務器采集到的流量進行數據分析。同時,在圖書館虛擬平臺還安裝有數據展示界面以及數據數據庫主控中心,控制著整套系統的數據展示以及策略的配置與下發。數據處理完之后,將處理的數據傳輸給數據存儲服務器進行存儲。數據存儲服務器負責數據存儲,將系統從哈爾濱工業大學日常的網絡流量當中挖掘出的數據存儲到本地的硬盤上,各個節點之間為數據互備、并行計算的關系。
圖1產品展示
4.2系統功能簡介及展示
本系統能對全網所有用戶訪問電子資源的訪問進行記錄。
圖2產品展示
經過數據云計算,全方位不同維度展示讀者使用電子資源的結果。詳細記錄每一個用戶使用所有電子資源的畫像。通過數據挖掘計算,得到哪些資源更有利于高校學科建設,為以后的學科建設、學術研究和圖書館的建設提供大數據支持方案。
?
圖3產品展示
針對惡意下載用戶,采用多種方式警告與封禁。
自動輸出圖表功能:通過定制任務模塊,管理員可以自由選擇時間,數據會進行自動統計與生成報表,可隨時下載。
支持最廣泛的電子資源:本系統內置上百種圖書館電子資源庫,同時可以根據學校的需求進行擴展,對資源庫進行最全面、最精準的分析、統計。
5.目前運行的效果
哈爾濱工業大學圖書館的老師每個學期向學校進行匯報,通過本系統可簡化管理員的工作。本系統提供完整的數據報表。定制任務,從各個角度分析電子資源的使用情況和生成多種報表,以滿足圖書館數據分析的需求。以前,電子資源若打不開,就只能依靠學生投訴來處理。本系統擁有資源健康檢測功能,每天定時對電子資源進行健康檢查,方便管理員及時發現處理問題。通過本產品,能夠為學校學科發展和圖書館建設工作提供準確有效的大數據解決方案。