去年AlphaGo戰勝李世石,人工智能的浪潮席卷全球,在教育這個數據密集型和知識密集型行業,人工智能對教育效率提升更是顛覆性的。人工智能技術在教育上的應用主要有語音識別、語義識別、大數據分析、自適應學習等技術。由于語音識別和語義識別底層技術突飛猛進的發展,使得大規模的機器口語測評成為可能。左馭在此文中主要探討教育中的語音識別應用,即口語測評領域。
一、口語測評市場規模:近三百億
左馭發表文章探討教育中的語音識別應用,即口語測評領域,看好具有應用場景數據庫和教育資源的公司。
以有考試培訓需求的用戶群體為口語測評的受眾群體,其對應的市場規模推導如下。據國家統計局數據顯示,2014年K12學生人數為1.6億人,2016年全國在校大學生人數為2599.1萬人,2016年出國留學群體約50萬人,在校研究生人數為200.4萬人。假設考四、六級大學生30%的人群使用移動在線口語測評產品,平均每人客單價500元。據此,預計2016年在線口語測評市場規模約283億元。目前口語測評付費率比較低,未來商業化發展空間巨大。
二、口語測評市場推動力:剛需、政策和技術
獲得英語資格認證、注重實用性代表人們對學習英語有剛性需求,這主要源于:其一,我國大學生、研究生和留學生群體需要通過英語資格認證考試,他們具有穩定的學習動機和需求;其二,我國年輕一代群體愈發重視英語的實用性,不僅是為了獲得認證考試,更重要的是提高英語交流能力。
在政策上,國家建立外語口語測評體系有利于口語測評市場的發展。中考改革新政策強化英語聽說的重要性,提升英語聽說測評標準,促進英語測評公司在英語考試、日常教學中的應用。目前,教育部在編撰國家英語能力等級考試,我國將建立起一個統一的外語測評體系。預計到2020年將基本建成標準統一、功能多元的現代外語能力測評體系,自上而下的英語考核標準的建立將影響到英語的教學目標、教學方式、測評工具等一系列的改革,具有教育內容資源、渠道資源和創新技術的口語測評公司將有廣闊的市場空間。
在技術上,隨著語音技術核心算法和計算機芯片技術的進步,尤其是深度學習算法和卷積神經網絡的普及,使得語音識別準確率從五年前的70%提升到90%。語音識別和語義識別在教育場景得到廣泛的應用,實現口語測評的規?;蛡€性化反饋。
三、口語測評:語音和語義識別在教育場景的應用
語音識別是將人的語音詞匯內容轉換成計算機可輸入二進制的編碼或字符序列,計算機將存放的語音模板與輸入的語音信號特征匹配完成識別過程。語義識別是通過建立有效的模型和系統實現語言單位的自動語義理解,從而知道文本的表達含義。
由于語音識別和語義識別底層技術突飛猛進的發展,使得大規模的機器口語測評成為可能。實現人機交互式教學,從傳統的老師輔導到人機一對一的輔導,大幅提升學習效率并節約經濟成本。語音識別在教育上的產品展現就是口語測評,體現在兩個方面。其一是對語音的流暢度和自然度進行打分,測評用戶的發音和母語說話人(native speaker)的接近程度;其二是識別出語言后,對語言組織進行后續的檢測。
口語測評市場產業鏈
四、口語測評市場格局
語音識別流程主要有兩種,第一種識別流程是前臺和后臺,第二種是端對端學習流程。前一種流程的前臺主要是將數據標準化,比如進行斷點檢測、除去噪音并進行特征提取,后臺主要是對特征進行解碼,所使用的工具包括聲學模型和語言模型。此外,一些公司還會加入“自適應”反饋,即通過用戶行為的反饋對聲學模型和語音模型進行校正,進而提高識別準確率。
語音、語義識別流程
端對端學習流程:語音信號-學習算法-轉錄結果,這種方法效果很好。這種方法需要在給定足夠的標準數據(音頻、轉錄)的條件,前提是需要足夠大的訓練集。
目前,口語測評市場主要有兩類玩家,分別是內容公司和技術公司。按照商業模式劃分,口語測評市場分為2B和2C。其中生產教育內容并基于教育產品開發技術公司,主要服務C端市場;而語言識別技術提供商,主要針對B端市場,服務于公立學校、線下教育機構和互聯網教育產品公司。
語言測評市場格局
五、口語測評投資亮點
口語測評市場是技術驅動和教育內容資源沉淀的市場,因此我們看好具有應用場景數據庫和教育資源的公司。以下是我們判斷口語測評公司的關鍵點:
第一,切入教育領域某一垂直場景,精準提供解決方案,語言學習測評未來的商業價值是專注于垂直場景,積累解決場景問題的數據,使得訓練語料與模型應用領域一致,形成資源集中,最大化的發揮模型效果;
第二,檢測語音學習的測評功能是否準確,訓練數據和語料選取是核心關鍵,一個成熟的語音識別系統需要成千上萬小時的語音數據訓練,不斷優化算法;
第三,團隊要產品和技術能力兼備,口語測評公司的團隊應該具備兩類人才,一方面是具有豐富教學經驗的教學內容研發團隊,給知識點和題目打標簽,幫助優化技術,促進產品快速迭代,另一方面是算法和數據團隊,通過算法和數據分析反饋對內容做最優化配置。