基于人類示范會顯著加速機器學習這一理念,加拿大初創公司Kindred AI 的人類 VR 操作員正在教授機器人執行新任務,其終極目標是創造一種全新的人工智能。
這個機器人手臂偶爾利用人工控制它學習如何掌握不同的對象
一家神秘的加拿大創業公司Kindred AI 正在教機器人如何以超人般的速度完成高難度的靈巧工作,他們把機器人與人類“操作員”配對——“操作員”們頭戴VR頭顯,手握運動追蹤控制器。
這種科技讓我們驚喜地見識到,未來人類將如何與機器進行同步工作。它向我們展示了,借助人類的協作可以進一步增強自動化系統的力量。
很多人對機器人和人工智能快要搶走人類的飯碗感到憂心忡忡,但其實還有很多事情是機器人無法勝任的。
由Kindred公司申請的專利圖,該公司由一批量子計算先驅創立,意圖打造先進AI系統來控制和訓練機器人
前不久,Kindred AI向《麻省理工科技評論》演示了他們的機器人,并表示,其將在接下來的幾個月里計劃發布一款針對零售商的產品。他們的長遠設想更是野心勃勃。
Kindred希望,這種人工協助式機器學習能夠培養出全新的更為強大的人工智能。
目前,Kindred正在測試傳統工業機器臂對于不好拿的小物件的抓取和放置能力,比如小塊布料,看其是否能比正常水平做得更快更穩。機器臂偶爾會向人類團隊求助,操作員們會在一旁通過VR頭顯,來觀察有困難的步驟,并臨時對機器臂進行人工操縱。
由Kindred公司申請的專利圖,展示了附有傳感器和動作部分的外骨骼,操作員穿著外骨骼控制遠方機器人
“操作員們可以看見、聽見并感受到機器人的所見所聞所感。當操作員做出一個動作,機器人也會跟著動”,Kindred聯合創始人兼CEO Geordie Rose說道(他也是D-Wave的聯合創始人)。
“這讓我們可以告訴機器人怎樣像人類一樣行動。雖然并不能說人類在所有關于機器人的行為上做得最快最好,比如把物件放置于指定方位之類,但人類在理解棘手和未知的情況方面依舊是最強的。”
Kindred的系統采用了一些機器學習算法,且會自主判斷哪一種算法能夠助其完成指定目標,比如抓取物體。如果沒有任何算法看起來可行,系統就會尋求人類幫助。
最重要的是,機器學習算法能夠學習人類操作員的動作。為做到這點,Kindred采用了“強化學習”——一種讓機器利用不斷嘗試和練習來學習特定操作的技術。
Rose表示,他們的機器人抓取小塊布料的速度是人類的兩倍,但若讓機器人獨立工作又實在是不靠譜。所以,人類介入是必要的,一個人可以同時操作多個機器人。
Rose補充說,Kindred正在探索各種含人類介入的操作系統,從人只要點擊圖像告訴機器人去何處抓取物件的基礎介入,到身穿全身機械外骨骼來控制類人機器人的高級介入。操作員都能學會如何有效地遠程控制機器人。“你剛開始使用控制裝置的時候會很不習慣,但人腦的可塑性很強,你會慢慢調整適應。”
這項技術的靈感來源于Suzanne Gildert,她原是D-Wave的高級研究員,現任Kindred首席科學官。
由Kindred公司申請的專利圖,展示了多名操作者通過該Kindred的人工智能云計算系統,實現對多臺機器人的控制
這家公司已經秘密運行了好幾年,直到Gildert提交的專利細節在網上曝光,吸引了人們的注意。專利描述了將各種不同的遙控操作系統與機器學習相結合的計劃。確實,Kindred的技術愿景遠不止做更好的分類挑揀機器人那么簡單。
“如果你讓機器人不斷地嘗試,并且有一套人工智能系統在背后支持機器學習,那么就能測驗不同的AI模型,看看哪個的訓練效果更佳,”Gildert說。“最終,我想到,如果你可以讓人類為機器人進行任務示范,那么沒有任何理由機器人不去像人類一樣操作。”
最吸引人眼球的是,Kindred的專利甚至涉及讓動物(比如猴子)操作這種系統的可行性。Gildert說這只是一個想法而已,公司并沒有雇傭任何猴子。但是她也說公司的確有一只通過強化學習訓練的機器貓整天在辦公室里晃來晃去。
知名量子計算機公司D-Wave的聯合創始人和首席技術官(CTO)Geordie Rose又醞釀新舉:使用人工智能和外骨骼系統訓練和控制一支智能機器人大軍
Kindred還有一點與眾不同,它的創始人是物理學家,而不是受過專門訓練的機器人專家或是計算機科學家。Rose辯稱,這反而為他們帶來了獨特而有價值的視角。“對于計算機科學家來說,模擬世界和真實世界的界限非常模糊。而我們更喜歡用真實的機器人在真實的世界里做點事情。”
Kindred追求的人機合作理念看起來的確潛力巨大。加州大學伯克利分校機器人和機器學習專長的教授Ken Goldberg表示,人類示范會顯著加速機器學習。Goldberg在他的外科手術機器人研究上采用了相似的方法,他補充說,讓機器人向人類學習是一個非常熱門的研究領域。Goldberg說,“這是我相信機器人具有無限未來的核心原因,人類的示范作用能帶來非常大的進步”。
但是,通過人類遙控進行機器學習的技術實現難度也不小。研究遙控類人機器人的麻省理工學院副教授Sangbae Kim表示,將人類的動作映射到機器行為上是件極其復雜的事情。
“第一個技術難點在于追蹤人類行動,得緊緊監視人類體表的所有細微動作。這非常困難,因為我們是內骨骼動物,”Kim說道。“更大的挑戰在于深刻理解人類決策過程中的每一步驟每一細節,然而很多思維過程其實都是潛意識的。”
但Kindred創始團隊并不氣餒。“我們的目標就是破解人類的認知體系”,Rose說道。“所有的生命都遵循特定的行為規律,而我們要為機器人建立一套同樣的行為準則。”
然而,也有一些專家懷疑,Kindred是否具備與他們宣稱的目標相稱的能力。威洛·喬治實驗室研究員、“赫菲”遠程控制機器人的發明人提姆·菲爾德(Tim Field)表示,該專利需要實現的機器學習技術已經遠遠超過了現有的機器學習技術,學習過程需要的數據和其他資源簡直是天文數字。
比如,谷歌的一臺實驗機械臂需要訓練80萬次才能成功從一個筐子里拿出物體,讓操作員執行同一任務80萬次來訓練機器人?這幾乎沒有可行性。
俄勒岡州立大學機器人專家比爾·斯瑪特(Bill Smart)表示,該專利提出的點子不錯,但是實現起來非常困難。此外,他認為,人類很難流暢操作這款機器人,因為機器服從的動力學原理和肌肉服從的動力學原理有不小的差別。