人工智能如何在金融、安保、醫療等各行各業中應用和落地,成為了行業從業者們思考的重點。其中,教育作為少數幾個幾乎可以覆蓋社會的領域一直備受關注。在以人為中心的教育領域,人工智能到底多大程度上改變教育?
本周繼續關注人工智能在教育領域的應用,并以語音技術落地語言教學為例,了解人工智能落地行業應用時的思考邏輯,技術為教育帶來的業態變化,剖析人工智能創業公司關心的數據和人才難題。
人工智能切入教育行業有何章法可循
哪個行業與人工智能結合更有前途,一直以來是投資人和業內從業者都關注的問題。通過長期采訪及企業調研發現,尋找行業結合點,利用人工智能順利切入行業,并帶來效率提升有規律和邏輯可循。
馳聲科技創立于2007年,起初利用人工智能聚焦對外漢語教學。2011年開始專注于將人工智能語音相關技術應用于國內英語教育領域。近十年的“人工智能+教育”從業經驗,讓馳聲科技的創始人兼CEO林遠東形成了自己的一套行業切入邏輯。
據林遠東介紹,人工智能主要分為兩個階段,第一個階段是機器模仿人類,替代人類做事情。這個階段主要包含簡單智能和復雜智能,兩者區別在于替代人類的層次高低不同。例如人工智能糾正發音不準替代相對簡單的人力,能評估開放性題型,評估口頭作文等千人千面情況,則是替代比較復雜的人力。另一個階段則是機器超越人類,做了人類沒做到的事情,行業內說的通過大數據找到人類發現不到的規律,這就已經超越了人類。
在林遠東看來,人工智能發展路徑是沿著簡單智能、復雜智能、大數據智能逐步推進。因此他覺得:“在切入一個行業時,需要衡量人工智能和這個行業結合的價值,價值等同于你能替代的那個層次人的勞動時間。大家找到一個行業,首先涉及一些相對復雜的決策,然后它又需要很多時間完成,這個行業必然就是一個非常棒的結合點。”
圖普科技有著多年利用人工智能實現在線視頻內容審核經驗,在其創始人兼CEO李明強看來:“切入一個行業需要根據馬斯洛需求理論。我們切入一個行業,必須從最基礎的那層服務開始做?;A需求就是生存,為了生存要審核這些。但是發展到一定階段,同質化產品嚴重,就要提高用戶體驗,考慮商業變現。有些人一進來創業就想做圖像識別的廣告平臺,違反了需求理論。你等到那個階段早就被我們從低做起的企業截流了。”
智能教育對行業的顛覆性改變還很遠
在按照規律選擇好切入行業后,人工智能的技術到底如何助力行業的提升?具體到教育行業,會帶來怎樣的改變?林遠東認為:“人工智能不單單替代人的勞動,而是必將走向數據智能,進而推動整個教學生態結構性的變化。隨著人工智能在教育領域普及,老師、學生他們的角色會在未來教學環境中發生重大變化。”
據他介紹,2012年,馳聲科技業務剛起步,應用其語音技術進行口語練習的人次一周約2000次。2015年,一天的錄音峰值達到千萬人次。林遠東認為:“隨著技術的助力,學生練習口語變得更簡單,利用口語測評技術,就能完成口語練習,機器會根據你的發音判斷是否像老外說的,并給每個人不同的發音反饋和指導。這樣一方面改變了學習的體驗,另一方面節省了老師大量時間。”
改變學習體驗和節省勞動力時間是簡單智能的替代,那么通過人工智能實現個性化教育和自適應教育,則是傳統教育寄希望于科技的關鍵點,覆蓋了復雜智能和數據化智能。
根據2014年9月國務院發布的《國務院關于深化考試招生制度改革的實施意見》,高考外語科目擁有了兩次考試機會。隨后,上海、北京等地相繼發布了各自細則,英語口語陸續納入未來高考中。這些變化給技術公司帶來了不小的機會。
林遠東介紹:“英語的教學會發生一個結構性的變化,由原來不考口語到考口語,實際上是一個很廣泛的適應過程,會掀起從教材到教材培訓一系列變化。”馳聲科技認為高利害關系的口語考試市場前景很大,接下來將是人工智能助力的重點。并因此形成了針對學校、教育局的口語考試完整的產品方案,以及針對學校備考的解決方案。
人工智能雖然改變了一些教育行業的業態,同時助力教育的改革,但是離行業顛覆性改變的距離還有很遠。在智課教育CEO韋曉亮看來:“在教育領域,人工智能再先進,機器也永遠都無法替代人的服務,因為這是一個以人為本的行業。機器的確是反饋的速度快,但機器是有盲區的,比如較感性的部分,而機器的盲區,必須由人來彌補。”
林遠東認為:“整個人工智能在各個行業的應用,依舊是簡單智能向復雜智能的過渡期,馳聲在人工智能應用的攀登上只是比較快地走出一兩步,依舊還處于簡單智能到復雜智能的中間。”
數據門檻形成馬太效益
有了切入行業的思考邏輯,以及改變行業的技術方法,在人工智能領域,足夠的數據積累是人相關技術得以應用的前提條件。很多初創的人工智能公司都苦于缺乏初始數據,陷入“巧婦難為無米之炊”的境地中。越是復雜的智能算法,需要的數據量越大。傳統的教育行業在教與學中,一直沒有數據積累的過程,直到國家推廣教育信息化,以及近年來在線教育的興起,教育領域才開始實現數據積累。
林遠東介紹,“當年在劍橋大學學習語音技術的時候,一個實驗室可用語音技術大概需要100小時的數據,訓練出來的模型基本上就可以用了,而一個商業化的技術需要300小時數據。”初創時期,馳聲科技通過購買各類公開數據,積累了幾千小時的數據量。與此同時,林遠東和創始伙伴也有過穿得西裝革履,帶上小禮物和錄音筆,站在學校門口找孩子錄英語素材的經歷。林遠東坦言:“最開始做數據積累的方法只能是比較原始的,原始積累蠻痛苦的。”
圖普科技的CEO李明強也表示:“很多創業公司要解決這個問題,就像無人駕駛行業,要自己去布很多車或者裝一些車去采集原始數據。”
經歷了初期數據的積累,成功研發產品后,大部分公司選擇迅速切入市場。通過服務企業與合作伙伴,獲取更多的數據。由于數據的授予具有排他性,一個企業不會同時向兩家技術公司公開數據,因此搶占數據,可以形成自身壁壘。
林遠東認為:“現在人工智能技術和行業結合依舊處于初級階段,還是有機會可以追趕的。接下來兩三年時間,整個行業不可逆地向復雜智能決策走。一旦走到此,需要的數據規模就已經是一個創業公司很難跨越的鴻溝。如果發展到大數據驅動的個性化學習,就完全沒有機會,落下功課太多了。”李明強也表示:“如果我們現在來做也很難做起來,由于做得比較早,我們的數據量并不比一些互聯網巨頭少,這樣才有競爭力。”
科技公司難覓專業人才
人工智能領域除了數據、算法、應用外,人才也是其中關鍵要素之一。人工智能涉及多學科交叉,記者走訪多家專注人工智能的企業,紛紛表示人才難覓,尤其是復合型人才。
林遠東覺得人工智能市場招募人才問題要分開看。他介紹:“找人才很難,主要是指找和行業深度結合的人難。找通用語音識別的人才沒那么困難,以口語評測為例。有聲學模型基礎,學信號處理或者模式識別的,就能從事這類工作。但是找一個通用領域識別且能和教育行業深度結合的人才就非常困難。”
技術人才是人工智能和行業結合的淺度需求,但是懂技術的行業人才則符合了人工智能與行業結合的深度需求。林遠東認為:一個通用語音技術或者通用智能技術可以輕易被替代,競爭壁壘很低,但是專注于行業應用會形成自身競爭力。
如今馳聲科技通過高薪聘請行業人才和自己培養高校畢業生兩種渠道完成人才儲備。林遠東看重的不是人才扎實的基礎知識,更看重能夠學習、超越、有好奇心等特質。京東金融在接受采訪談到人才招募時表示:“我們需要的人才必須具備清空自己,進行自我迭代的能力。”而在李明強看來,更傾向于招研究基礎科學的人才。他介紹:“我們要從數學系和物理系找。我們做人工智能就是很基礎的原理。”