2009年,Google通過分析5000萬條美國人最頻繁檢索的詞匯,將分析結果與美國疾病中心在2003年到2008年間季節性流感傳播時期的數據進行比較,并建立一個特定的數學模型。最終google成功預測了2009年冬季流感的傳播甚至可以具體到特定的地區和州。
2013年,微軟紐約研究院的經濟學家大衛羅斯柴爾德(David Rothschild)利用大數據成功預測24個奧斯卡獎項中的19個,成為人們津津樂道的話題。
馬云說:互聯網還沒搞清楚的時候,移動互聯就來了,移動互聯還沒搞清楚的時候,大數據就來了。2016年由全國電子商務職業教育教學指導委員會指導的一項“商務數據分析與應用專業人才需求調研”結果顯示目前數據工作一線人員的學歷情況,數據崗位中高職高專、大學本科分別占比50.49%、41.67%。數據崗位的五大崗位群中,北京對本科學歷的要求均排在第一,而浙江在客戶服務類和運營類崗位中高職高專學歷排在首位,同時浙江“沒有學歷要求”的占比遠高于北京。
職業教育的目標是滿足個人的就業需求和工作崗位的客觀需要,進而推動社會生產力的發展,加快國家產業結構的調整與轉型。隨著大數據時代的到來,職業教育將迎來怎樣的機遇與挑戰?職業教育又如何在大數據時代尋找并抓住機遇?這不僅僅是職教圈需要研究的問題,也是絡捷斯特一直以來特別關注的問題。
北京絡捷斯特科技發展股份有限公司(股票代碼:834832)作為一家專業提供人才培養模式創新服務整體解決方案的公司,一直以來秉承務實奮斗、開拓創新、保持領先、實現共贏的經營理念,積極探索大數據時代學習和教育的未來,于2017年6月正式上線了長風大數據平臺(http://www.cfdsj.cn)。平臺上豐富的數據資源、先進的數據挖掘分析工具、結合實際業務場景的三級創新實驗, 解讀如何讓職業教育在大數據時代抓住大機遇。
大數據蘊藏大能量
大數據(Big Data)是指“無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的數據集合。”業界通常用4個V:即數據體量巨大(Volume) 、數據類型繁多(Variety)、價值密度低(Value)、處理速度快(Velocity)來概括大數據的特征。
長風大數據平臺提供了物流、電商、交通、公共、貿易等多行業、海量的過程性、個性化數據,這些數據詳細的記錄了事務的產生背景和產生過程,真實且易于理解,既可以滿足學生的課程實驗需求,也可以滿足老師的科研活動需求。
專業工具釋放數據價值
隨著大數據時代的到來,個性化需求不斷涌現,傳統的數據管理和業務分析工具及技術都面臨大數據的壓力,各行業都在紛紛探索新的大數據分析與挖掘方法,如EMC的Greenplum,惠普的Vertica和TeradataASTERData以及阿里從最初的4個節點Oracle RAC到20個節點Oracle RAC,再從數百臺到數千臺的Hadoop,直到目前擁有數萬臺ODPS的數加云平臺。
從存儲及支持大數據處理的服務器端技術到為終端用戶帶來鮮活體驗的前端數據挖掘與可視化工具,絡捷斯特也在不斷探索,隨著長風大數據平臺的上線,專業的大數據分析與挖掘工具也開始為用戶服務。整個平臺包括大數據聯機分析處理平臺(OLAP)、大數據多維分析平臺、大數據可視化平臺、大數據挖掘平臺四個子平臺,為不同專業水平、不同應用需求的院校和師生提供服務。
大數據聯機分析處理平臺(OLAP),底層基于Apache Kylin,是構建在Hadoop之上的數據倉庫系統,支持SQL查詢接口及多維分析(OLAP)能力,支持超大規模數據,實現亞秒內的查詢響應。
圖-大數據聯機分析處理平臺(OLAP)
大數據多維分析平臺,讓學生基于大規模數據集,選擇指標和維度實現多維分析,并且可以對數據進行“切塊和切片”,鉆取到細節中從而揭開數據的關系,實現數據的深度分析與洞察。
圖-大數據多維分析平臺
數據可視化平臺,分為可視化交互界面、數據采集與編輯、組織結構及權限管理、圖表拖動縮放、可視化分析五大功能模塊,學生可以通過簡單拖拽進行炫酷的可視化展示。
圖-大數據可視化平臺
大數據挖掘分析平臺具備數據描述與理解功能、數據獲取與組織功能、數據挖掘建模功能,提供分類、聚類、關聯規則、推薦等方面的多種算法,并支持對算法的擴展。學生可以更深入的研究和學習不同算法支持下的分類、聚類、關聯規則、預測等問題。
圖-大數據挖掘平臺
三級創新實驗培養創新型人才
長風大數據平臺基于目前的數據集,開設了倉儲、運輸、供應鏈領域的多個創新實驗方向,并基于大數據應用路徑的遞進關系,形成了Level1—數據認知:初步認知與統計、Level2—業務分析:規則發現、Level3—運營決策:復雜系統決策的三級創新實驗項目。
這些實驗結合實際業務場景,旨在訓練學生的整體思維能力、分析能力、解決問題能力、批判性學習和創新能力,重在培養學生創新性思維,建議通過小組討論、創意設計、答辯展示等環節完成整個實驗過程,并鼓勵形成創新成果。
圖-運輸網絡優化實驗
絡捷斯特將繼續從實際教學需求出發,探索將數據思維、運營思維、優化思維和創新思維融為一體的方法,基于數據、工具、實驗和認證為用戶提供體系化、標準化、專業化的教學產品。讓大數據為職業教育提供重要支撐,促進大數據與職業教育的融合,實現一定的創新創業成果產出。