許多孩子天生就是藝術家,他們的蠟筆畫被父母掛在冰箱上。隨著年齡漸長,他們往往失去用藝術表達自我的自由靈感。當一個同事說她整個周末都在涂涂抹抹時,大部分人不會認為她在畫畫,而是以為她在粉刷房屋。
讓手機攝影愛好者能夠把自己的照片與名畫模式相融合,從而創造出獨一無二的數字藝術作品,這種天生的才能是人工智能(AI)設計師植入Pikazo應用的一個特點。
Pikazo圖片
Pikazo是在被其創始人稱作“深度神經網絡”的基礎上開發的,這是一個模仿人腦和神經系統的計算機系統。充分利用人工智能并通過強大的英特爾計算性能而實現,這款應用讓人們重新獲得自己與生俱來的創造力并創作出具有大師風范的藝術作品。
與那些在人們記憶中轉瞬即逝的Snapchat或Instagram圖片不同,Pikazo所創作的作品更像是藝術品。
Pikazo聯合創始人Noah Rosenberg表示:“人們會說:‘哇哦,我想再看看這幅圖。’”
Pikazo之所以獨特,是因為它不只是對圖片進行過濾。相反,這款應用的神經網絡會以意想不到的方式重新安排原始圖片的元素——就像把面孔重鑄到抽象肖像中。
Pikazo利用這種神經風格傳輸算法,把一個圖片的風格融合到另一張圖片中,從而創作出全新的作品——這個作品既有兩幅原始圖片的神韻,但是又與原圖有天壤之別。
來自人和機器的藝術——它的運作原理是什么
Pikazo應用融合的兩張圖片,一張圖片是“被畫的”主題(例如一張自拍),另一張圖片則顯示畫圖的風格——可以是達芬奇的《蒙娜麗莎》也可以是畢加索的立體主義風格。
Rosenberg解釋道:“如果我給它一張我的圖片,再給它一張梵高的《星空》,它就會把這兩張圖融合到一起。”
原始圖片
這就是它的運作原理。神經網絡,或者模仿人腦的軟件,包含經過訓練可識別圖片的探測器層。當Pikazo識別一個具體形狀時,它激活一個特定的神經路徑。檢測器層讓它能夠對一幅圖片進行深入理解。
Pikazo圖片
英特爾優化Torch深度學習框架助力Pikazo實現飛躍性突破
Pikazo的代碼最初充分利用Visual Geometry Group和Torch現有的開源神經網絡項目,這個機器學習框架可通過圖形處理單元(GPU)來渲染圖片。
這也是一個復雜的流程,神經網絡必須運行在云中,而不是用戶移動設備上。在云中可用的GPU只允許Pikazo處理300萬像素的圖片,需要花30-45分鐘來創建,而渲染一張3.5兆的圖片需要大概一個小時,這也幾乎是GPU可以渲染的極限,這動輒數十分鐘的渲染時間無疑非常影響用戶體驗。
為了尋找一個能夠縮短渲染時間的解決方案,Rosenberg找到了英特爾。
英特爾幫助Pikazo遷移其神經網絡代碼庫,使其運行在英特爾至強處理器和英特爾云服務上。并幫助其對Torch進行優化,實現飛躍性突破,
通過優化的軟件,Pikazo能夠不再依賴那些用來為應用生成藝術作品的昂貴的專用硬件。降低成本意味著Rosenberg能夠降低通過該應用創建更大的海報尺寸版本的藝術作品的成本,從而大大加速了Pikazo的廣泛普及。
正如Rosenberg所說:深度學習框架Torch的優化使得我們的成本降低了14倍,把在英特爾CPU上處理高分辨率圖片的時間從超過1個小時縮短到大約5分鐘??s短低分辨率圖片的處理時間也降低了免費處理圖片的開銷。大大提升的響應速度和更低的成本已經大大改善了Pikazo的業務。例如,Pikazo在2016年8月4日的一周內就處理了超過20萬張圖片。
Pikazo免費創建基本圖片,并銷售可創建更高分辨率圖像的增強功能。一開始,高清圖片的價格是15美元?,F在,用戶只需花1美元就能創作高清圖片。
這幫助Pikazo增加了用戶群并擴大了藝術創作的規模。Pikazo最初生成的圖片打印出來只有3英寸——比智能手機的屏幕還小。Rosenberg說,現在Pikazo的內存容量足以支持大得多的圖片。
Pikazo的成功,是英特爾積極布局人工智能領域的有力驗證。英特爾公司軟件與服務事業部副總裁開發者及產品部總經理Bill Savage 表示:為了推動AI應用的普及,英特爾注重開拓行業上游市場,增強行業影響力。而通過與開發源頭的軟件所有者合作,能夠幫助其改善和優化產品,從而引導人工智能社會效益最大化。
英特爾正充分利用自身技術和產品創新的整合優勢,為人工智能提供全面的、極為靈活的端到端解決方案產品組合:構建于業界領先的基于英特爾架構的涵蓋至強處理器、至強融核處理器、Nervana平臺和FPGA、Omni-Path網絡、3D XPoint存儲等技術的硬件平臺,結合英特爾針對深度學習/機器學習而優化的英特爾數學函數庫(Intel® MKL)、英特爾數據分析加速庫(Intel® DAAL)等,和致力于為多節點架構提供卓越性能的開源軟件框架如Spark、Caffe、Theano以及Neon等,及可推動前后端協同人工智能發展布局的Saffron、TAP、Nervana 系統、Movidius等工具和平臺,以上這些產品組合將最終幫助廣泛的行業和企業更方便地獲取、開發和部署人工智能應用,將人工智能潛能在各個領域中充分釋放,如智能工廠、無人駕駛汽車、體育、欺詐檢測、生命科學等等。