紐約時間2016年11月13日下午4時,北京時間14日凌晨5時,紐約大學Courant研究院CILVR Lab實驗室與享閱教育正式宣布成立中文分級閱讀及中文NLP研究聯合實驗室。
紐約大學Courant研究院是全美最著名的數學研究院,其下屬的The CILVR Lab (Computational Intelligence, Learning, Vision, and Robotics)則是國際上最為享有盛譽的人工智能及機器學習實驗室之一。而北京享閱教育科技有限公司則是一家扎根于中國教育土壤的科技創業公司,始終致力于通過機器學習與數據挖掘等新技術,打造完善的中文分級閱讀標準和自適應閱讀平臺,進而徹底改變中文學習者的閱讀現狀。此次聯合實驗室的成立,意味著更多國際最前沿的機器學習的研究成果將適用于中文語言處理的領域,以幫助中文分級閱讀標準的建立,此外,雙方的合作方向還將覆蓋中文NLP研究和閱讀數據挖掘在內的多個細分領域。
聯合實驗室的CILVR Lab實驗室方面負責人Jake ZHAO博士作為深度學習領域的專家,具備多年自然語言處理和計算機視覺研究經驗,師從機器學習頂尖學者、深度學習奠基人之一的Yann LeCun教授。LeCun是紐約大學終身教授,同時也是Facebook人工智能實驗室的負責人。為了表彰他在深度學習領域里的成就,IEEE計算機學會曾為其頒發著名的“神經網絡先鋒獎”。此次聯合實驗室的成立,也得到了LeCun教授的支持與肯定。
趙博士表示,在美國,超過95%以上的學校在使用分級閱讀的相關產品來收集和分析學生的閱讀數據?;诜旨夐喿x標準記錄的閱讀能力評價是除去數學、英語成績外最重要的學習評價指標。借助分級閱讀系統,美國學童從小就用科學的方式涉獵歷史、地理、人文、科學,新聞。而中國因為缺乏科學的中文分級標準,閱讀能力難以量化,孩子的閱讀興趣低下、結構不均、成長性差,以致中國兒童的閱讀量只有美國的六分之一左右。在過去囿于技術的原因,很多基礎性的研究難以開展,但最近幾年深度學習的方法興起,極大推動了NLP領域的研究進程。深度學習帶來的變化主要是特征的定義與抽取。無論是基于單字,還是基于詞,最近幾年都已經進行了不少這方面的研究嘗試。
趙博士進一步指出,NLP中文本是非結構化的數據表示,需要通過特征提取,抽取關鍵信息以用于機器學習模型的分析處理。因為其特征的復雜性與非線性,在未來deep learning技術有著很廣闊的發展空間。最近十多年,機器學習的發展非常迅速,新的模型,新的算法層出不窮。中文分詞由于其重要性,以及問題的清晰性,成為很多新研究的試驗場。在未來,將與享閱教育首先在中文的NLP研究上進行深度的合作,并且在此基礎之上,共同運用Deep Learning方式來打造中文分級標準的黑盒模型。
人工智能正在迎來新的產業爆發期, 2018年全球人工智能市場近470億美金,年復合增長率55.1%。在可預期的未來,下一波教育創業浪潮的核心驅動也一定是來自以人工智能為核心的“科技+教研創新”的融合。
2016年,享閱教育與國內頂尖的認知語言學學者團隊合作研發完成了第一個擁有完整自主知識產權、以高級算法為核心并具有深厚語言學根基的中文分級閱讀標準,同時,享閱教育主持了國內第一個有關中文分級閱讀量化標準有效性的實證研究項目。據悉,享閱教育的技術與教研核心團隊均來自于北京大學,CEO與CPO則畢業于常春藤名校,此次與世界頂尖機器學習實驗室的合作,勢必將進一步夯實其在中文分級閱讀和自適應學習領域的領先地位。