2016年6月6日,由清華海峽研究院、北京清華工業開發研究院、數據科學研究院共同主辦的“清華人工智能論壇”在清華大學成功舉辦。本次論壇邀請了清華人工智能領域的權威專家和校友產業界代表相聚清華,學術泰斗與產業嘉賓思想碰撞,共同為人工智能發展問診把脈。6月8日,微軟亞洲研究院常務副院長芮勇也在清華大學發表了精彩演講。整理演講內容如下:
微軟亞洲研究院常務副院長芮勇:人工智能趨勢之四化
“人工智能”一詞最早出現于1956年,近年來“人工智能”越來越熱,人們對此也感到一些困惑。未來,人工智能的發展趨勢應是大數據化、自適應化、可穿戴化和增強化。
大數據化
微軟認知服務是把微軟過去二十幾年做的人工智能分支的技術,包括計算機視覺、語音、語言、搜索等技術放在認知服務上。這樣的好處是當人們想開發一個App的時候,不用重新開發,直接調用即可。
圖1為估算顏齡的一個網站:www.how-old.net,在這上面首先要知道人臉在什么位置,其次是判斷性別。2015年底,發布了第二個版本,可以估計出人類的情感、喜怒哀樂等?! ?/p>
2011年以前,深度學習在沒有被引入計算機視覺之前,其錯誤率大約為百分之二十幾,直到2012年,深度學習第一次被引入計算機視覺,這時錯誤率大幅下降到百分之十幾,之后幾年更是降到了10%以內。
此外,物體檢測是比物體分類更難的事情,特別是像素級別的物體分割。我們知道一張圖片有很多像素級別,每個像素是屬于貓,還是屬于這只貓邊上的草,每一項都要進行分類,這是非常難的。從圖片分類到物體檢測,再到像素級的物體分割,為什么計算機視覺可以做到?這是因為人類生成了很多的數據,這些數據被拿來訓練計算機,它才能夠有一定的智能,這也是第一類趨勢--大數據化。
自適應性
在電影《星際迷航》有這樣一個場景,不同的星迷去不同的星球探索,可以通過一個機器來進行交流,這在當時還是一種科幻。研發人員總能把科幻變為現實,目前有一種實時翻譯器,使得兩種說不同語言的人可以實時交互。大約在2010年時微軟內部進行了展示。2015年,我們將這項技術加入到Skype里。
其中,必須要有四項技術做得非常好。第一步,中文的音頻系統要被實時翻譯成中文文字,并且要非常準確;第二步,因為是日常的對話,會有一些口語,嗯、啊等,需要把這些地方進行翻譯;第三步,中文文字翻譯出來之后,需要翻譯成外文文字;第四步,把這些外文翻譯成語音。同時還要注意翻譯出的聲音應該是像同一個人說話,這也是我們提到的自適應化。
可穿戴化
隨著計算機視覺技術的發展,未來計算機看到圖2時,會告知一名男子正騰空而起表演滑板特技。微軟有一款設備--Hololen,能夠實現兩個不同物理空間的人可以在同一個空間進行交互?!?/p>
增強化
人工智能和人,并不是誰PK誰的問題。計算機比人類強的就是它的存儲功能和記憶功能,它是一個很好的左邊半個大腦的補充。未來,不是人對抗機器,而是人加上機器,讓人類變得更加厲害!
(本文整理自微軟亞洲研究院常務副院長芮勇博士在“清華人工智能”論壇上的演講,未經本人確認)