導語:一場高考機器人和狀元的PK賽,讓不少人覺得人工智能牛逼的不要不要的。不過,很多人看到人工智能技術的進展時,也有一些疑惑,比如為什么沒能實現“絕殺”?一位科技圈AI程序猿圍觀后,分析推測了幾點關于高考機器人的秘密。
幾天前,學霸君的高考機器人Aidam和6位高考狀元的場外PK又讓人工智能在教育領域掀起一個小高潮。最后Aidam取得134分的成績,以1分的微弱劣勢負于高考狀元(高考狀元平均分135分)。有點遺憾,人工智能沒有在高考這一年度盛事上再現AlphaGo完虐人類的場面。
高考機器人為什么沒有實現完虐?
其實在技術層面上,高考機器人是可以拿到滿分實現完虐的。那它為什么沒有拿到滿分?從既有的新聞報道來看,初步推測,Aidam解題分三步:
讀題并翻譯成形式化語言;相當于翻譯成內部邏輯語言;
根據已有規則,使用內部邏輯語言完成解題過程;
將解題過程或結果翻譯回來;
眾所周知,數學是邏輯體系最為完備的學科,題解過程中的所有邏輯均可從基本的定理和公理推導出來,因此只要讀題正確的話,解題應該沒有問題,即b步驟應該不是失分的原因。最大的失分原因,恐怕是計算機沒有理解題目的意思,或者有所偏差。目前有一點不太確認,就是Aidam是從圖片中讀取題目,還是人工錄入的方式讀題。
如果Aidam是以圖片的形式讀題,那么讀題的過程可以分解為兩個過程:光學字符識別(OCR)將題目圖片轉化為文字,另外就是使用NLP技術理解題目的意思。OCR技術,簡單來說,就是使用計算機識別圖片中的文本,目前廣泛應用于拍照答題和計算機視覺的其他應用。對于標準化的打印體,OCR識別的準確率非常高。因此,如果是識別試卷上的數學題,機器的識別度應該不存在問題。
所以,恐怕最大的問題是NLP技術有待提升。NLP技術,即自然語言處理(Natural Language Processing),指使用計算機技術和人工智能技術理解、處理人類語言的技術,目前在智能客服、聊天機器人、新聞機器人等眾多領域廣泛應用。
與此相同,另一個機器人AI-MATHS失分的原因也是“讀不懂題目”。確實,自然語言處理(NLP)被譽為“人工智能皇冠上的明珠”,確實有非常大的難度。
機器人只能考數學嗎?是不是可以高考6門科目統統虐一遍?
很多人可能會問,為什么挑戰的是數學,其它科目是否也可以?
首先,選擇數學肯定是有原因的。數學邏輯完備,對于計算機來說是最容易推理的。在題庫類的產品中,最先整理出來的也是數學科目。
那挑戰其它科目是否也OK?學霸君的采訪中說目前在數學、理綜和英語方面已經都有把握,不過語文還需要探索。
早在2013年開始,日本機器人Torobo-kun開始參加日本高考,據說物理成績不錯,但其他科目較差。今年由于理解題意太困難而放棄了參加。其實,我覺得只要有足夠的訓練材料,語文也是可以解決的。語文除了題意更加難懂外,相對于其他學科的額外難度,主要在與主觀題較多、較抽象上面。
事實上,機器的閱讀能力已經有很大提升,在閱讀理解測試上目前微軟能夠達到76%的正確率。至于主觀題,也是可以嘗試解決的。目前學界已經有很多利用循環神經網絡(RNN)來寫古詩的,其效果看起來還不錯,甚至還可以寫藏頭詩。摘錄2首作詩機器人的作品:
海棠花—紅霞淡艷媚妝水,萬朵千峰映碧垂,一夜東風吹雨過,滿城春色在天輝。
鏡—照影金精映,釵頭角黍青,白發紅袖下,明月滿庭清。
這兩首詩的標題是人自由選定的詞匯,詩的內容由作詩機器人完成。另外,國外還有很多人利用該技術作曲。
Ai-maths與Aidam有什么不同?
準星機器人AI-MATHS最終得分105,Aidam得分134,兩個機器人本身是否有高下之分?
從報道上看,成都準星云學科技有限公司推出的AI-MATHS與Aidam還是有一定區別的。由于AI-MATHS訓練樣本較少,并且是在斷網的情況下答題,因此雖然AI-MATHS分數較低,但在相同情況下,AI-MATHS能力未必低于Aidam。準星技術的設計初衷是在斷網的情況下,人工智能對于生活和學習的幫助,目前已經開始幫助參加高考閱卷工作。
所以,可能不用太久,虐完理科狀元,高考機器人就可以完虐文科狀元。想象一下,機器人和人類PK寫天馬行空的高考作文,一起吟詩作賦還是很好玩的。人工智能技術突破的速度很快,可以實現的場景也將越來越多。未來,在教育領域的應用還會有更多更有意思的東西出現。