?上周,創新工場首屆中美教育沙龍在北京舉行。創新工場負責教育領域投資的中美兩地團隊,及其投資的十多家教育項目公司集體亮相。
據創新工場美國高級投資經理包蓓蓓介紹,創新工場一直非常重視 AI 這條線,包括 AI 在教育方面的應用。2013 年 7 月,創新工場投了計算機視覺公司 Face++,之后連續在該領域布局 30 家公司。包蓓蓓表示,AI 是非常大的生態系統,從數據、計算機、算法框架,到具體的硬件、關鍵的零部件和應用機器人,工場會看顛覆性的商業想法,還有真正將其落地的產品。去年李開復領銜做了一個內部的人工智能工程院,會從技術、產品、交互上給工場的項目公司提供支持。
據包蓓蓓介紹,工場過去幾年投了 5、6 家在 AI 和大數據應用方面真正實現教育落地的產品,其中包括來到現場的盒子魚和學吧教育。在對談環節,包蓓蓓、盒子魚創始人黎小說和學吧教育 CEO 李行武都強調了數據對于 AI 應用于教育的重要性。
包蓓蓓表示,現在大的廠商在開源各種數據框架,降低非技術人才或低技術人才的門坎。因此,未來算法作為秘密武器的作用會被削弱,而誰有數據,尤其是結構化的數據,將成為真正的秘密武器。她介紹,AI 創業公司獲取數據基本上有 3 條路:1、買數據;2、從渠道伙伴那里間接獲得一些數據;3、設計一些小的技巧去獲取用戶的數據,比如用免費產品獲取數據來支撐后續付費產品的設計。
盒子魚創始人黎小說也強調,未來一定是誰有數據誰就能夠做人工智能。黎小說在 2015 年 6 月接觸到深度學習,之后很快就成立了人工智能實驗室,研究深度學習如何應用到教育中;到 2016 年 8 月,盒子魚 8.0版上線,正式將人工智能運用于盒子魚教學全過程?,F在大數據成為了他們的優勢,“每天收到 800 萬到 1000 萬條的學習朗讀數據,這個時候簡直太輕松愉快了, 一個 model 60% 到 80% 一個月跑完了,80% 到 90% 的準確性只要半個月,很快就是 95%。”
李行武表示,今天大家已經達成共識,數據才是中長期的壁壘。
他指出,拿 K12 數據無非三大環節——學、練、測。測評環節很低頻,第一個被排除掉。教學的數據線下是沒有的,有兩大原因:1、,主流教學模式是一對多,拿到的教學過程數據只是把老師講課的過程錄下來,根本拿不到學生側的數據,是單向的;2、即使單向的數據都很難有,很少有人把一堂課錄下來。
相比之下,練習側數據非常多,而且是結構化的。所以學吧選擇先做題庫了,目前積累了 7 億條中學數學的做題數據。“不謙虛地講,在國內數學領域應該是最好的數據,不管是在質量還是數量上面。”李行武表示。
有了數據之后,學吧開始重新從練習環節走回教學環節,開始做教學導航系統,利用這些數據做輔助老師上課的系統。“本質上就是讓普通老師也可以把課上好,這樣就可以把老師的供給極大地放大,在教學質量不下降的前提下。”在課外一對一輔導中,導航系統幫助老師做兩件事:
備課。系統針對每個學生生成一學期的課程計劃,像導航一樣,輸入起點、終點、篩選條件,生成路徑。上課中學習需求有變化,系統會自動重新規劃教學計劃。
上課。系統生成講義,告訴老師如何講解知識點,難點在哪里,何時做練習,等等,將教育過程標準化。精細化的過程管理可以把總體教師的水平拉到一個比較好的水平線上,把對人的要求降下來,容易復制。
李行武表示,學吧的終極理想是做一個虛擬老師,就像做自動駕駛,前一步應該是輔助駕駛,輔助駕駛的前一步是導航,所以現在在做導航系統。