數據科學與大數據技術專業,專業代碼:080910T,無疑是未來十年最火的專業,甚至沒有“之一”。
2020年3月,138所高校獲批第五批“數據科學與大數據技術”專業,180 所高校獲批新增人工智能本科專業。經過前幾年密集的申報、備案與審批,開設“數據科學與大數據技術”專業的高校已達619所,開設“人工智能”專業的高校達215所。再加上“大數據管理與應用專業”、“大數據技術與應用專業”,中國在大數據及人工智能相關領域的高等教育呈現出大爆發態勢的同時,版圖已經接近確定。這也意味著,經過4年的密集審批期后,“數據科學與大數據技術”專業將進入建設期和考核期。
《普通高等學校本科專業設置管理規定》(教高﹝2012﹞9號)中規定“ 第十八條 高?,F設專業連續五年不招生的,原則上按撤銷專業處理。第二十六條 高校設置的專業在教育教學過程中出現辦學條件嚴重不足、教學質量低下、就業率過低等情況,高校主管部門須責令有關高校限期整改、暫停招生?!倍虝r間內,這么多高校密集開設“數據科學與大數據技術”專業,必定面臨相當程度的競爭,也必將會有部分高校專業的教學質量不達標而面臨困境。
數據科學與大數據技術”專業是新興學科,可供借鑒的經驗較少,許多高校對于完整的數據科學與大數據技術專業人才培養,還沒有一套成熟的規劃方案,各高校在新專業的課程建設路上還是存在著諸多挑戰。
首先,投入資金和資源要求高。數據科學相關技術需要的資源配置比較高,這妨礙了許多高?!皵祿茖W與大數據技術”專業落地實施;同時,作為應用型學科,數據科學的教學中需要有大量行業真實數據和項目資源支撐。
其次,學生實踐機會少,數據科學來源于各類行業場景,注重實踐訓練和案例教學,是一門與實踐高度結合的學科。要進行大數據分析,必須要有充足的高質量數據和統一的實踐平臺,然而多數高校缺少企業項目實戰案例和可以用于研究的商業數據,使得學生難以做到學以致用。
近期,一份著眼于“數據科學教育”課題的《數據科學教育白皮書》在教育圈內廣為流傳,首次解答了“數據科學與大數據技術”這一未來十年最火專業應該怎么建設的問題。
《數據科學教育白皮書》由數據科學協同平臺企業——Heywhale和鯨科技發起,聯合TDU騰云大學、AWS共同推出,通過豐富的行業研究數據,真實的教育實踐案例,深度剖析數據科學教學流程中的痛點與機會點,完整呈現了數據科學教育的4大階段,新學科教育工作者全面梳理數據科學教育知識體系、學習路徑、產業實踐及生態圖譜。
《數據科學教育白皮書》獲得了來自中國人民大學商學院院長毛基業教授、中國人民大學統計與大數據研究院院長艾春榮教授、北京大學光華管理學院商務統計與經濟計量系系主任王漢生教授、華東師范大學數據科學與工程學院副院長周烜教授、AWS首席云計算技術顧問費良宏等多位大咖的認可和推薦。
教育部“長江學者”特聘教授,國家杰出青年科學基金項目獲得者,中國高被引學者,國際信息系統學會中國分會理事會主席——毛基業教授在序言中這樣介紹道:“為什么要加快推進高校的數據科學教育?其知識體系包括哪些內容?如何建設高水平的教育項目?這份白皮書給出了非常好的答案(Why, What and How)。隨著中國社會全面進入移動互聯時代以及大數據應用的相應普及,市場對數據科學人才的需求巨大。美國高校的數據科學教育項目已經遙遙領先,國內企業和高校學生在供需兩端都在急切地呼喚更多更好的數據科學教育項目!”
《數據科學教育白皮書》認為數據科學教育項目有別于傳統學科項目,需要具備協同性、整合性、敏捷性和生態化的特征,要完整地打造一體化的數據科學教育項目,需要完成4個階段性任務以構建完整的教育流程:
第一階段 : 數據科學知識體系的掌握
數據科學是一門知識體系復合且專業性極強的學科,在數據科學的高校教育中往往會遇到學科背景局限和高校相關資源稟賦匱乏的情況。數據科學是作為通用目的技術(general purpose technology)賦能其他應用場景,因此針對交叉學科的培養、課程大綱設置的科學性、以及教學方式的適用性等帶來諸多挑戰。高校中針對交叉學科背景的建設的基礎較弱,成熟度有待加強。同時,高?;A資源較為分散,教程路徑較為固化,也為數據科學教育的推廣帶來難度。因此一套科學的教綱、知識天梯和流程模塊尤為關鍵。
第二階段:階梯式實踐路徑與實戰項目
數據科學作為實操性極強的學科需要科學的實踐路徑與工具的掌握。但是正因為數據科學的知識體系較為龐雜,因此在實際教學過程中,往往會出現教學平臺(工具)的資源缺口和真實數據與案例沉淀缺失的問題?;诖?,和鯨認為基于云端化和協同化的數據科學實操,是在以科學的、循序漸進的實踐路徑中的重要支撐。
實訓機制是以讓學生完成完整的數據科學項目為導向設置的實踐類型,國外已有較多高校開設實訓營以培養學生達到能用數據科學方法解決實際項目的目的。在現階段國內高校中,依舊存在著實訓統一工具管理困難、流程設置的科學性、目標與成績評估和管理等問題。和鯨認為,以項目為導向的數據科學教育要注重“CBL + Design Thinking + 全流程云端工具”,實現“理論知識+數據資源+人才潛力”的匯總,把握真實問題、真實業務,創造真實價值。
第三階段:真實行業場景中創造業務價值
通用目的技術(General Purpose Technology)是一種能夠賦能泛產業實現產業轉型升級的底層技術,數據科學教育的真正價值也在于能夠幫助學生明確場景的可改造性、技術的可落地性以及技術的可迭代性。但在現階段的國內數據科學教育中,依舊存在著場景探索缺失的問題,缺失真實場景用于實踐、數據難獲取以及缺失行業導師的指導解讀。和鯨認為,數據科學教育需要充分挖掘不同的應用場景,要梳理一套完整的、科學的和可復用的價值流程,基于流程化的教育管理完成對于學生場景認知的教育,立足于真實的業界場景,完成創造真實價值的落地閉環。
第四階段:開放生態的深度連接
數據科學教育在國內依舊處于迅速發展的階段,關于教育生態的資源整合以及學生就業發展選擇的路徑中,同樣存在諸多痛點。如何更好的銜接科學研究與普適學習?如何在把握教育方向的前提下提高科研效率?如何提高教育生態中資源整合的效率?都成為亟需解決的問題。
和鯨認為,背靠協同共享的學習機制,充分調動教育生態中的伙伴資源,打造“數據池+人才池+平臺算力支撐+協作共享機制”的閉環,可以加速數據科學的落地效果。
“數據科學是大數據時代應對人類對“數據發現”的需求而成長起來的新興學科,它具有多學科領域交叉的特點以及實際中的應用性。因此,如何構建多學科領域交叉的人才培養體系,培養復合應用型的創新人才是擺在各國面前的巨大挑戰?!敝袊嗣翊髮W統計與大數據研究院院長、教授、博士生導師,美國佛羅里達大學惠靈頓工商管理學院經濟系終身教授——艾春榮教授這樣推薦道,“和鯨科技與騰云大學發布的《數據科學教育白皮書》,以國際教育的視角審視我國教育現狀,并從數據科學的學科價值和教育痛點,推演出“產學研”結合的教育新范式,對我國數據科學教育具有指導和示范意義?!?/p>
《數據科學教育白皮書》完整版,請至Heywhale和鯨科技或TDU騰云大學官網下載閱讀。