?
摘要:
我們正在進行一場比賽,但是我們不知道如何到達終點,或者我們要走多遠。我們從周圍風景判斷我們已經跑了多遠。
何時能達到真正的人工智能時代?這可能是未來學家、AI 專家和對科技有著強烈興趣的人們都很關注的一個問題。人工智能的新進展何時會發生是很難預測的,達特矛斯夏季人工智能研究計劃的科學家在 1956 年便認為 AI 在一系列復雜的問題處理上,或許兩個月就足以產生“重大進展”。
六十年過去了,而這些問題依舊沒有解決?,F在,斯坦福大學的AI 指數試圖去測量人工智能發生了多大的變化。
這個指數采用了獨特的方法并試圖在多個系統中匯總數據。它包括活動量的規模,這些規模用于衡量風險投資,出席學術會議,發表的論文等等的活動。
該指標還從熱門的編碼網站Github上獲取數據,該網站擁有比世界上任何地方都多的源代碼。他們可以跟蹤人們創建關于 AI 的軟件數量,以及對熱門的機器學習軟件包(如 Tensorflow 和 Keras)的興趣。該指數還記錄了不同人提及AI新聞文章時的情緒:令人驚訝的是,關于 AI 威脅和就業危機,那些被認為 “對未來積極” 的人比 “對未來消極” 的人多三倍。
這一切都可以成為人工智能熱度的一種衡量標準。
沒有人會否認,我們正處在一個人工智能炒作的時代,但人工智能迅猛增長的發展卻充斥著各種 AI 炒作案例以及AI 寒冬的交替出現。因此 AI 指標試圖依賴一系列任務去追蹤算法的進度。
在其他狹窄的領域,人工智能仍在追趕人類。翻譯算是比較好的了,通常你可以通過翻譯得到正在說的內容的要點,但是在翻譯準確性方面,還遠低于 BLEU 指標。
我們可以注意到算法在先前為人類服務的任務上的特殊性能- 例如,指標引用了一篇Nature論文,顯示AI現在可以比皮膚科醫生更準確地預測皮膚癌。
未來幾年,人工智能的進展更有可能類似于逐漸上升的潮汐,因為越來越多的任務可以轉化為算法,由軟件完成,而不是突然的智能爆炸或一般智力突破的海嘯。也許可以通過測量人工智能系統的能力來學習和適應基于辦公室任務的人類的工作程序。
AI 指數并沒有試圖給出一般智能的進展表,因為這仍然是一個模糊的概念。
牛津大學計算機科學系主任邁克爾·伍德里奇(Michael Woodridge)指出:“報告中沒有記錄一般人工智能的主要原因是,我和其他人都不知道如何衡量進展。”他擔心另一個人工智能的寒冬,并對外宣布“江湖騙子和油嘴滑舌的推銷員”夸大了已經取得的進展。
當然,你不需要一般的智能來影響社會,算法已經在改變我們的生活和我們周圍的世界。畢竟,亞馬遜,谷歌和 Facebook 為什么值錢?專家們一致認為這需要衡量人工智能益處的指數、人類與AI之間的互動,以及我們將價值,道德和監督編入這些系統的能力。
哈佛大學的 Barbra Grosz 認為,“通過對人們生活的影響來確定人工智能系統是否成功是很重要的。”
對于那些關心人工智能就業啟示的人來說,跟蹤在被認為最脆弱的領域(比如,自動駕駛汽車取代的士司機)使用人工智能將是一個好主意。應該衡量社會適應人工智能趨勢的靈活性;我們是否為人們提供足夠的教育機會來再培訓?教他們如何與算法一起工作,把它們當作工具而不是替代品來對待?專家們還指出,這些數據是以美國為中心的。
我們正在進行一場比賽,但是我們不知道如何到達終點,或者我們要走多遠。我們從周圍風景判斷我們已經跑了多遠。出于這個原因,從定義 AI 進展開始,衡量 AI 進展便是一個艱巨的任務,但 AI 指數作為相關信息的年度收集是一個不錯的開始。