? 2017 年國務院印發《新一代人工智能發展規劃》,規劃提到“人工智能 教育”深度融合已開啟。教育領域已成為人工智能重要應用場景之一。在線教育企業如TutorABC、101教育、英語流利說等,互聯網創業企業如科大訊飛、網龍等紛紛步入“AI 教育”這一賽道。談AI教育的企業眾多,而真正能夠實現AI融入教育的企業恐怕屈指可數。
做人工智能的企業,必須具備這三大要素:算法、計算力和大數據。而隨著框架平臺的開放,各個企業之間在算法上相差并不多,計算力逐漸成為基礎設施,而人工智能的決勝因素在于大數據的積累與沉淀。
互聯網創業企業獲取數據基本上有三種方式:一是買數據;二是從渠道伙伴那里間接獲得一些數據;三是通過一些營銷手段去獲取用戶數據。
花錢購買數據,簡單而粗暴但需要企業有強大的財力支撐;從渠道間接獲取數據,難以保障數據獲取的持續性;通過營銷手段獲取用戶數據,在營銷成本不斷增加的今天,數據獲取很難形成量級。而不論是以上哪種方式獲取數據都存在兩大問題,問題一是這類數據并非結構化數據,拿到這些零散的數據無法直接用于AI計算,而將數據結構化并非是一朝一夕能夠完成的,需要耗費大量人力長時間地為數據打標簽,形成積累;更嚴重的是,拿別人的學習行為數據來給自己的學員做學情分析,得到的學習方案很可能會使學生出現“排異”現象。
而真正意義上的教育企業,獲取數據的主要途徑是來自實際教育過程中的積累。學生學習的數據會通過系統的搜集功能,進行篩選、分類并儲存,為每個學生建立專屬的數據庫。隨著教學活動增多,數據量積累越來越大,數據類型越來越多樣性。而AI系統在進行大數據運算的過程中,數據量越大,數據類型越多樣性,計算結果也就越精準,這樣得出的學習方案才是最科學有用的。因此,優質的教育大數據,往往掌握在運營時間較長的教育企業中。
成立于2004年的成人英語在線教育企業TutorABC,利用人臉識別技術采集學員上課投入、互動情況,當這些數據累積達到一定量級以后,用自研的AI系統分析這些數據并根據分析結果對課堂教學環節和內容作出適當調整,從而為學員提供更精準的教學服務。
成立于1996年的K12在線教育企業101教育,是一家教學教研型教育企業。據創始人黃女士透露, 101教育22年的教學資源和數據構成了三棵大樹。一棵是不斷完善的課程體系樹,大樹隨著課程的改革不斷的修建生長;一棵是知識點樹,將各學科、各年級所有的知識點標簽化,形成五級標簽化的知識點矩陣;另一棵樹就是沉淀了101智適應學習平臺上億用戶行為數據的用戶數據樹,這些數據作為AI運算的基礎,清晰勾勒出每個學生的學習畫像。智適應學習系統根據學習畫像,基于101課程體系樹和知識點樹的結構化數據為每個學生有針對性地推送知識點、練習題、測試卷。隨著資源和數據量積累不斷增多,智適應學習系統也就越“聰明”,對學情的分析也就越精準,學習方案越適用,這樣就形成良性循環。
由此可見,AI教育到底能不能做好,不在于技術能力,而在于數據基礎。而數據基礎的搭建并不是純靠財力和營銷手段能夠建立的,一定是具備教育基因,沉得下來的企業才能真正做好。創新工場高級投資經理包蓓蓓也曾公開表示,隨著大廠商開源技術框架,技術門檻在降低,結構化的數據將成為真正的競爭核心。教育的下半場,一定是誰能獲取更多的優質教學數據,誰就有AI教育的主動權。