機構知識庫可持續發展策略研究
錢建立[1],李鵬[2],李若溪[3]
1: 《電子設計工程》雜志社 西安 710075
2:陜西省科技信息技術研究所 西安 710054
3:《重慶師范大學學報》編輯部 重慶 400047
摘 要:剖析了目前國內外機構知識庫存在的“雞肋”現象,把原因歸結為沒有很好兼顧機構構需求和成員需求,提出知識服務平臺除了被唯一化的機構公開成果庫功能外,還應具備內部資料庫、異構資源互聯、成員資源集聚、知識再組織、科研秘書、團隊協作、科學社區等七種功能,為學習和科研提供有價值的服務。認為讓科研人員在享受到有價值服務的同時,又不需要付出太多額外勞動,而能實現機構知識的自動集聚,是解決機構知識庫建設的“最后一公里”瓶頸的方向,并設計了個人成果收集的具體實現方案。
關鍵詞:機構知識庫,知識管理,知識再組織,科研協作,文獻管理,科研助理
分類號:G255.75 文獻標識碼 A 文章編號 1002-1965(2012)11-0176-05
On Sustainable Development Strategy of Institutional Repository
Qian Jianli1, Li Peng2, Li Ruoxi3
(1 Electronic Design Engineering Magazine, Xi’an 710075)
(2 Shaanxi Provincial Scientific Information & Technology Institute, Xi’an 710054)
(3 Journal of Chongqing Normal University Editorial Office, Chongqing 400047)
Abstract: There is few reasonable considerations on both institute requirement and member requirement is regarded as the main reason of institutional repository’s “chicken ribs” phenomenon. To change the situation, Institutional Repository should provide valuable service for learning and research. Besides of institutional public works exhibition, IR should also support internal material database, interconnection of Heterogeneous resources, concentration of member resources, knowledge reorganization, research assistant, team coordination and science community, so that researchers can enjoy more valuable services without inputting too much extra labor, and the automatic concentration of institutional knowledge may become much easier. The scheme of personal works collection is also designed.
Key words: institutional repository; knowledge management; knowledge reorganization; team coordination; science community
0 引言
機構知識庫(Institutional Repository, IR)目前正在得到廣泛的重視,從高校[1]、研究院所[2],正在擴展到政府部門和企業。然而對于機構知識庫的定義則存在不同的理解,也導致了目前機構知識庫不同的結局。金春梅把之前機構知識庫的定義歸納為兩大類[3],一類是以美國網絡信息聯盟的常務董事Clifford A. Lynch為代表的“IR 是一種服務體系”,認為“機構知識庫是指大學為成員提供的管理、傳播自己創造的數字資料的系列服務”[4]。另外一類是以SPARC 資深顧問Raym Crow為代表的“典藏、展現說”,認為機構知識庫是某個大學把其師生創造的數字知識進行永久保存,用來提升聲望”[5]。
這兩種定義存在一個共同點,就是限于機構“生產”的數字資源。目前大多建設起來的機構知識庫,大多基于以上兩種定義。
國內外研究機構之所以對機構知識庫有如此熱情,是因為已經有很多成功的案例。麻省的教案倉儲影響到了中國[6],俄羅斯數學家因2002年在Arxiv上存檔的一篇論文獲得了2006年素有數學界獎諾貝爾獎之稱的菲爾茨獎[7],Stanford大學的HighWire[8]已經在清華大學建立了影像站點,Lord大學的DOAJ也成為了開放存取期刊存檔的旗幟[9]。
然而遺憾的是,在目前已經建起的2040個機構知識庫中[10],能引起關注的,為數寥寥,很多機構知識庫淪為了“雞肋”。除了“典藏”功能外,提高機構作品影響力的這一點期望,也因為大多研究人員更希望從來源更廣泛的專業數據庫來查詢資料,也變為了“空中樓閣”[11]。
從韓珂的調研中,可以對目前很多機構知識庫沒有達到預期效果的原因可以管窺一斑[12]。
1) 研究人員獲取信息的渠道更傾向于涵蓋國內外研究成果的專業數據庫,而不是從僅有一家機構成員的機構知識庫。
2) 僅有2%的研究人員愿意“自主提交”文獻,大多數研究人員認為機構知識庫建設是機構方的事情,最好由知識庫管理員來協助提交。
3) 在機構知識庫上存檔的作品得不到官方的認可,99.5%的研究人員更愿意在傳統期刊上來發表自己的作品,只有0.6%的研究人員選擇機構知識庫。
這些原因可以歸納為兩點:
1) 機構成員在機構知識庫建設中,義務多于獲得的服務,甚至在一些機構是只有義務,而沒有任何有實用價值的服務。
2) 機構知識庫還停留在機構公開成果庫階段,未能把機構中大多有價值、特色的知識作品進行整合。
中科院國家科學圖書館對機構知識庫的定義讓人對機構知識庫的未來變得重新充滿了希望。“機構知識庫是研究機構實施知識管理的工具,是機構有效管理其知識資產的工具,也是是機構知識能力建設的重要機制[13]。”在這個定義中,機構知識庫的范圍從機構的“知識產品”擴展到了“知識資產”。“產品”是自己生產的產品,而“資產”則不僅僅包括自己的產品,也包括購置的知識產品。
筆者認為,機構知識庫應該是把機構內各種系統、各個團隊、各個成員散存的各類知識成果的記錄、集成、再組織、展現,展現機構成果,盤活機構知識資產,為成員、團隊提供學習、科研服務支持。
1 機構知識庫的功能分類
知識庫建設的投資方和建設方位機構,但其使用者和參與者為機構成員,因此機構至少說要想可持續發展,必須要同時滿足這二者的需求。
圖1是機構知識庫的機構屬性功能和服務屬性功能。
2 機構知識庫功能的機構屬性
2.1 公開成果庫
目前大多已建成機構數據庫基本都實現了這個功能。這個功能分解、擴展為:
1) 機構科研成果的“檔案館”、“櫥窗”和 “展示廳”。
2) 貢獻者的“光榮榜”。為機構做出貢獻的研究人員,理應得到致敬和褒獎,機構也應該記住那些做出貢獻的人。
3) 機構成員積極價值觀的“課堂”。弘揚先進,就是明示機構的價值趨向。
4) 機構影響力的“助推器”。如果能把機構成果開放存取,對提高機構和作者影響力能起到一定的促進作用[14]。
2.2 內部資料庫:過程文件、實驗記錄檔案館
在科研機構,發表、通過驗收和評審的最終報告、方案、論文、專著、專利,固然是一個機構的成果和財富,但那些實驗數據、培訓教程、講座、過程文件等非公開發表文獻,同樣有著重要的價值。
1)非公開文獻的針對性更強
和購買的文獻、數據庫相比,一個機構的實驗記錄、歷史文檔,和實際工作往往有著更密切的關聯,因此對一個研究機構有著更現實的價值。
2)未公開發表文獻,也具有參考價值,甚至更高
這些沒有公開的文件、記錄同樣花費了精力、心血、時間、經費。
由于論文篇幅的限制,有些詳細的實驗記錄無法全部發表,而具體數據對后來的研究人員來講往往更有價值。
即便是結果失敗的研究,也能成為后來者的“前車之鑒”。
3)社會更需要非公開成果檔案
公開成果已經有了專業數據庫,如知網、萬方期刊數據,國家專利數據庫,而目前非公開成果的數據庫還很少,研究人員獲取實驗記錄等非公開文獻的需求更迫切。由于目前公開的實驗記錄庫還很少,這方面的努力更能提升機構影響力。
非公開成果包括:試驗記錄、報告草稿、教案、PPT、視頻、培訓教程、工作規范、源程序、設計文檔、需求文檔、產品使用手冊等。
考慮到非公開文獻,可能涉及機構、部門、個人機密,因此其訪問范圍可以分為公開、機構內、群組內、特定成員間;訪問權限可以分下載、評議,可設置為不同的訪問權限組合。
麻省理工大學開放教案是內部資料存檔的成功案例,此外莫尼黑大學的基因GeneCenter 數據庫已經廣為生命科學研究人員認可[15]。
2.3 異構資源互聯
大多研究型機構都有自己的網站、情報系統(圖書館)、郵件系統,有的還有辦公平臺、ERP等,但這些系統大多為不同公司產品,彼此之間獨立。此外大多屬機構都購買了很多知識服務和產品。
機構知識庫一個很重要的功能就是把機構內的 “信息孤島”聯通起來,把不同來源的文獻進行有機的融合、沉淀、梳理、分類,形成一個機構知識庫,集中展現、搜索、使用。
在進行這些異構資源整合時,希望原系統開發廠家來提供統一資源接口,往往僅是美好“愿望”,可操作的辦法就是使用搜索引擎技術,把所有資源進行某種形式的“收割”。
異構資源互通,應該以不影響原有系統的使用為原則。如果能提供一些插件,如IE中的搜索插件,在實現資源互通外,還能改善原來系統的功能。
資源互通,應以提供便捷的搜索接口,如Google那樣的便捷搜索和高級搜索為使用目標??紤]到大型研究機構往往需要圖書館借閱系統相關聯,因此還應該在“快照”中輔之其它有價值信息,如是否可供借閱等。
2.4 成員資源集聚
大多機構成員都收藏了一些工作有關的文獻。把機構成員個人資源進行匯集、梳理、分享,并為成員提供“資源備份”功能,可作為機構知識庫一個的輔助功能。
1) 成員收藏文獻中,有的來源于機構購買的數據庫,很多則是機構成員通過其他渠道收集的,這些資源可以豐富機構知識庫。
2) 成員收藏文獻過程就是一個文獻甄選過程,成員收藏文獻大多是價值度高、和機構研究方向密切相關的文獻。
成員收藏文獻整合中需要注意的問題:
1) 版權問題。成員收藏的文獻,大多不是機構成員發表的文獻,機構可能沒有這些文獻的傳播權,因此只能內部使用,或者團隊內使用,切忌對社會公開。換一種思路和視角, “整合、收割”可以認為是為機構用戶提供的一種“文獻代存、備份”的技術服務。
2) 知情原則。整合機構成員手中文獻,要讓成員知情,明示自動收割文獻的范圍,以及不愿意“自動備份”文獻的處理方法。切忌在不告知的情況下,收割成員文獻,這將引起機構成員的“抵觸”甚至“敵意”。
3) 尊重成員意愿,給成員選擇權。成員收集、撰寫的某些文獻不一定愿意公開分享,或者只愿意在自己設定的范圍內分享,甚至不分享,成員的這些權利要得到尊重。
2.5 知識再組織
一篇文獻或一部論著中,有價值的往往僅僅是其中的一部分。打個比喻就是:人類的知識就像一粒粒的“珍珠”,掩藏于文獻的“蚌殼兒”中。目前的搜索引擎能幫助找到可能包含需要知識珍珠的“蚌體”,但里面是否有需要的知識,掰開“蚌殼”以后才能知道,而且要花費力氣去發現珍珠。如果能把“蚌殼”掰開,摘出珍珠,并串成珍珠項鏈,那將節省大量的時間,使得知識獲取變得更加高效、容易。
知識再組織將改變圖書館目前主要的“Buyer”角色,給機構的圖書館、情報系統帶來角色的升華,使其成為知識再組織的參與者和服務提供平臺。
知識再組織,將為機構提供一個全新的平臺,使其成為人類知識樹上的某些節點的組織者,通過這些知識節點的組織,機構將贏得關注,提高影響力。
3 機構知識庫功能的“服務”屬性
機構知識庫作為研究型機構的一種基礎建設,最原始功能應該是為機構成員的科研和學習提供服務。但目前大多機構的圖書館和情報部門,其功能已經簡化為資源購買和自習場所提供。
3.1 科研助理
大多科研人員,都希望擁有一個科研助理,來幫助收集、記錄、提醒、處理一些信息和事務。
對于機構成員個人而言,機構知識庫的科研、學習服務功能可以概括為:知識獲取、知識管理和知識應用。
3.1.1 知識獲取
知識獲取,就是及時獲取自己感興趣的各種資訊,包括最新文章、專利、會議通知、基金申報信息、最新產品等。知識獲取分為積累性知識獲取和積累性知識獲取。
1) 目標性知識獲?。耗繕诵灾R獲取就是為了某一項目、某一任務,需要在短時間內獲取到相關的信息。目標性知識獲取的最有效方案為搜索。目前大多數的數據庫都提供豐富的搜索功能,但遺憾的,某個技術人員需要的文獻分散在眾多的數據庫中,需要在眾多的數據庫中,如SCI、Springer、Elsevier、IEEE,Pubmed、知網、萬方、專利數據庫等,逐個搜索。提供到眾多專業數據庫“一站式”搜索的“元搜索”將成為未來科技搜索的方向。
2) 積累性知識獲?。悍e累性知識獲取沒有特別強的目的性,是為了知識積累而進行的知識獲取。積累性知識獲取的最佳方式為訂閱,新興起的微博也正在以一種新型的訂閱改變著“訂閱”的習慣。訂閱不不僅僅包括純專業資訊,也包括基金項目申報、學術會議等信息。
3.1.2 知識管理
知識管理的核心功能就是把收集到信息進行分類、標記等,提高效率。具體為:
文獻
文獻和文件、文稿的區別在于,文獻的內涵不僅僅包括全文文件,更重要的是包括相關的元數據。如一篇期刊文章的元數據包括標題、作者、發表期刊,年卷期,頁碼,摘要,關鍵詞,DOI、甚至包括參考文獻。文獻管理的主要功能,就是支持能從主流數據庫中,把讀者關注的文獻方便導入到個人知識庫中,而不用通過復制、粘貼繁瑣的操作。
目前很多研究人員都在使用專業的參考文獻管理軟件,如EndNote,Mendeley, NoteExpress,NoteFirst[16],這說明研究人員需要這樣的服務。
文稿和文件
文稿就是用戶自己撰寫的各種文檔。文稿中最有價值的一種應用就是試驗記錄。
文稿管理的主要功能就是文稿模板提供、文稿審閱、版本記錄、分類標引和快速定位。
目前一些國家重點實驗室在使用北京庫巴扎的E3-Lab[17]試驗記錄平臺,說明了包括實驗記錄在內的文稿管理是研究人員需要的一種服務。
網頁和知識卡片
隨著博客、倉儲的發展,互聯網上存在很多有價值的知識,這些網頁、網頁中精華內容的快捷保存也逐漸成為知識管理的重要組成部分,研究人員需要把把有價值的網頁進行快捷保存,并把保存的網頁制作成電子書。
3.1.3 知識應用
目前知識應用的突出代表就是“寫作助手”和“發表”。
?寫作助手
參考文獻管理軟件的一個主要功能就是寫作時,根據不同期刊、出版社對參考文獻的規定,自動形成規范的參考文獻。這個功能對于需要獵取上百篇參考文獻的博士、碩士學位論文作者來講,是一項非常具有實用價值的功能。
發表
“發表”包括在公開出版出版物,如期刊、學術會議上發表,也包括在一些倉儲上進行存檔。機構知識庫也是一種存檔形式。
此外,知識進行關聯,分享等也是一種知識應用。
3.2 團隊協作
目前的科研已經進入了團隊協作時代。在一個機構內,往往有很多研究團隊(如研究室、研究組、課題組等)。大學和研究所中,一個導師就帶領一個團隊。
團隊協作應具有的功能包括:
團隊成員中資源的分享、積累和傳承
機構成員中大多每人都收集了很多文獻,完成了很多實驗記錄,撰寫過論文和報告,這些資源不應該隨著學生的畢業離校、成員的崗位調動而流失,需要把散存在機構成員中的有價值資源變成團隊的積累。
文稿共同撰寫和評閱
一些報告需要多人合作完成,還要經過導師和團隊負責人的評閱。這些評閱、修改記錄也是團隊的一種財富,機構成員通過批注來學習其他人的視角和考慮問題的思路,還可通過版本記錄來分體味脈絡。
交流
成員之間的交流,團隊公告、通知、任務安排等。
QQ群具備團隊寫作的雛形功能,但僅僅提供了文件分享功能,尚不提供文獻分享、知識卡片分享、文稿評議和共同撰寫功能。此外QQ群的數據,機構無法控制,對安全性存在顧慮。
目前NoteFirst、Mendeley、EndNote已經具備了其中文獻資源分享功能,NoteFirst 2.0還提供網頁和知識卡片的分享功能,北京庫巴扎的E3-Lab專用于團隊的實驗記錄分享。
3.3 科學社區-跟隨性閱讀
“新浪”微博和“人人網”社交網絡,目前風生水起,究其原因就是滿足了“社交”功能。雖然,目前“微博”的用戶人數正在迅速擴大,但微博中大多為非科技資訊,尚無法滿足科研人員的特殊需要??蒲腥藛T希望科學社區的功能包括:
結識同行
最好不要局限于同一機構,最好不要限于相同資深程度。
討論共同感興趣的話題
跟隨性閱讀
如果某個資深專家愿意把閱讀過的文獻、訂閱的期刊,作為一種信息分享給關注者,關注者即可沿著專家的足跡前進,事半功倍。這種獲取知識的方式可稱之為“跟隨性閱讀”。
目前基于文獻的社區已經得到了主流數據商的支持,NPG集團推出了connatea[18],Springer推出了CiteUlike[19],德國的researchgate[20]已經得到了德國馬普學會的支持。
4 個人成果自動收集
機構知識庫建設中的主要“瓶頸”就是機構成員成果的收集和確認,NoteFirst提供個人成果收集工具,其重要作用就是幫助成員自動收集個人知識成果,再經過成員人工確認,確認后的個人成果可通過OAI接口導出,或者被機構知識庫自動收割。
其核心思想是利用數據庫提供的高級檢索功能,到多個數據庫去查詢指定機構的作者的文獻。要求同時輸入姓名和機構,機構和命名之前關系為“與”,以保證檢索結果的精確性;機構、作者的中英文及其變種之間的操作為“或”或關系,以提高檢索結果的全面性。圖2是NoteFirst的個人知識成果收集窗體。
圖2 NoteFIrst的個人成果收集窗體
檢索結果被轉換為RSS,作者通過RSS訂閱來及時收集到個人成果。
其中支持的來源數據庫種類決定了輸出結果的全面性,目前NoteFirst支持知網、萬方、國家圖書館、SCI、EI、SSCI、ISTP、Pubmed、Springer、ScienceDirect、NPG(Nature Publishing Group)、Wiley等主要數據庫。
遺憾的是無法區分同機構同姓名的作者,因此必須引入人工審核機制。
5 結束語
機構知識庫,要想得到可持續發展,需要兼顧功能的“機構”屬性和“服務”屬性,不可偏頗。最好分階段實施,能在接受時限內,取得一定的效果,引起社會各界的繼續支持。在以上列舉的功能中,公開成果庫、過程文獻庫、異構資源互通、科研秘書、團隊協作可以在第一階段實施,而成員文獻集聚、知識再組織、科學社區可后期實施。
機構知識庫最原始的功能是機構公開成果庫,也是機構知識庫發展的初級階段,但如果機構知識庫止步于機構公開成果庫,就可能讓有發展潛力的機構知識庫淪為“雞肋”。
另外之前的大多機構知識庫中的文獻來源是通過成員人工提交,在機構知識庫建設過程中,機構成員是承擔了義務,而沒有獲得更多有實用價值的服務,機構知識庫是“剃頭挑子一頭熱”。如果能讓機構成員在享受到需要的服務的同時,而又不需要付出太多勞動,實現機構知識的自動集聚,那無疑將解決機構知識庫建設的“最后一公里”瓶頸。
參考文獻
[1] 廈門大學圖書館.廈門大學學術典藏庫[EB/OL].[2011-08-21]. http://dspace.xmu.edu.cn/dspace/.
[2] 中國科學院國科圖書館.中國科學院國家科學圖書館機構知識庫[EB/OL].[2011-01-23]. http://ir.las.ac.cn/.
[3] 金春梅.近五年來我國機構知識庫研究綜述[J].圖書館學刊,2008(6):8-10.
[4] LYNCH C A. Institutional repositories: essential infrastructure for scholarship in the digital age,ARL, no. 226[R/OL], 2003: 1-7.
[5] CROW R. The case for institutional repositories: a sparc position paper[EB/OL]. [2011-08-22]. http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf.
[6] 北京分形科技有限公司.中國開放教育資源聯合體[EB/OL].[2011-02-27]. http://www.core.org.cn/.
[7] 佚名.2006國際數學家大會:菲爾茨獎花落四家[EB/OL].[2011-08-23]. http://news.xinhuanet.com/tech/2006-08/22/content_4994657.htm.
[8] Stanford University Libraries. Highwire[EB/OL]. [2011-02-27]. http://highwire.stanford.edu/.
[9] Lund University Libraries. Directory of open access journals[EB/OL]. [2011-01-08]. http://www.doaj.org/.
[10] University of Nottingham. The directory of open access repositories - opendoar[EB/OL]. [2011-01-23]. http://www.opendoar.org/index.html.
[11] BUEHLER A M, BOATENG A. The evolving impact of institutional repositories on reference librarians[J/OL]. Reference Services Review, 2005, 33(2): 291-300.
[12] 韓珂,祝忠明.科研機構對機構知識倉儲認知和服務需求調查分析[J/OL].現代圖書情報技術,2008(3):12-17.
[13] 中國科學院國家科學圖書館.機構知識庫[EB/OL].[2011-08-23]. http://www.las.cas.cn/kycg/jgzsk/.
[14] EYSENBACH G. Citation advantage of open access articles[J]. PLOS Biology, 2006, 4(5): 692-698.
[15] The Gene Center of the University of Munich. Gene center munich[EB/OL]. [2011-08-21]. http://www.lmb.uni-muenchen.de/.
[16] 西安知先信息技術有限公司.NoteFirst網絡版參考文獻管理軟件[EB/OL].[2011-02-27]. http://www.notefirst.com.
[17] 北京庫巴扎信息科技有限公司.E3-Lab電子實驗記錄系統[EB/OL].[2011-08-21]. http://www.cobazaar.com/.
[18] Nature Publishing Group. Free online reference management and sharing for researchers and scientists[EB/OL]. [2011-02-27]. http://www.connotea.org/.
[19] SPRINGER. Citeulike: everyones library[EB/OL]. [2011-02-27]. http://www.citeulike.org/.
[20] researchgate net. Researchgate is the professional network for scientists[EB/OL]. [2011-02-27]. http://www.researchgate.com/.
作者簡介
錢建立,男,1964年出生,博士,主要研究方向為開放存取、搜索引擎、元數據抽取和機構知識庫,《電子設計工程》主編,西安知先信息技術有限公司(http://npuweb.notefirst.com/ http://teamplat.notefirst.com/)總經理,中國科技期刊編輯學會數字出版和發展專業委員會副主任,Email:Jack.qian@notefirst.com ;李鵬,男,1979年出生,陜西省科學技術信息研究所助理研究員,研究方向為科技成果管理與評估;李若溪,女,1959年出生,編審,重慶師范大學學報編輯部主任,中國高??萍计诳芯繒W術工作委員會主任,研究方向為開放存取。
論文基金情況
國家社會科學基金,項目名稱:開放獲取(OA)學術資源分布和集成形式分類與可持續發展研究,項目編號:10XTQ007。
教育部人文社科研究規劃基金項目“網絡學術資源分布和集成現狀與傳播效率研究”,項目編號:10YJA860011。
文章發表于:《情報雜志》2012年No:11