李飛飛、吳恩達、張潼、馬維英、Pieter Abbeel、Oussama Khatib……;騰訊、阿里、今日頭條、滴滴、科大訊飛、唯品會、斯坦福、UC伯克利、清華……集齊全球頂尖的AI領域領軍人物,踏訪中美兩國科學研究及應用探索前沿的科技公司/大學的AI實驗室,濃縮在飛越太平洋的9天內密集拜訪和交流,這是一種什么感受?
一句話:大腦的“CPU”、“存儲空間”和“接口”都已不夠用。
9月14日-22日,紅杉中國攜手真格基金,定向邀請三十余位成員企業的創始人和高管,一起享受了一場智能超感的“北京-硅谷AI雙城記”之旅。這是一次名副其實的大腦體操,對于在各個垂直領域已經取得初戰勝果的創業者們,這更像是一趟尋找AI+商業“終極算法”的解惑之旅。紅杉資本全球執行合伙人沈南鵬和真格基金創始人徐小平也參與了“AI雙城記”硅谷段的部分活動環節,兩位都非常關心AI產業將對教育領域帶來哪些改變。
紅杉資本全球執行合伙人沈南鵬:人工智能是信息科技高速發展的重要產物,如果企業家能夠把握好未來5-10年市場研發方向與機會,應當可以獲得前所未有的長足進步,獲得跨越式發展。
真格基金創始人徐小平:工業時代是把流水線上的人變成機器,而AI時代則是把機器變成人。AI的廣泛應用,如果能夠極大提高生產力、極大地解放人類,將是非常了不起的事情。
紅杉中國為什么要做這件事?
從計算時代、網絡時代到AI時代,是紅杉資本與全球技術創新浪潮并進的45年。即使你已熟悉車庫故事、多次到訪沙丘路,但你仍然可能對硅谷——這片長約25英里的狹長谷地有所不知。從早期的通訊技術研發基地,到半導體巨頭的搖籃;從斯坦福的工業園,到風險資本的初始之地;從軟件、互聯網的勃興,到今日AI之風勁吹,硅谷已成為全球技術變革的代名詞,并一次次挺立于創業創新的潮頭。
在計算時代,紅杉資本發掘了蘋果、投資了Oracle、思科……;在網絡時代,它投資了谷歌、雅虎、領英、YouTube、Airbnb、阿里巴巴、京東、滴滴、今日頭條……;現在,當科技世界叩響AI時代的大門,它再一次以超越科技躍進和市場波動的眼光,把握先機,提前布局。
搭建中美AI前沿對話的平臺,投資早期AI創新創業之新荷。紅杉中國致力于成為頂級高成長企業最早、最重要的投資人,作為創業者背后的創業者,不僅是發掘和以資金資源支持創業新秀,更不一樣的是,給予創業者以成長幫助并陪伴長跑。怎樣為創業者打開世界觀?紅杉中國愿意成為AI前沿對話的“搭橋者”、“造雨人”、“連接器”,為創業者提供有針對性的高端對話機會,搭建更廣闊的深度互動交流平臺。
紅杉資本中國基金合伙人周逵帶隊參與了北京段的參訪行程。他說,組織這一場活動,初衷是給紅杉中國投資的AI領域成員企業提供實際有效的幫助,為此主辦方為每一站活動主題都盡量做了細化、聚焦,希望令所有參與人的興趣點更加集中,溝通更有效率。
紅杉中國今年已舉辦了近十場類似的投后服務活動,希望通過這些高質量的交流活動,幫助CEO了解到產業核心企業的動態和想法,認識行業最牛的人,做最準確的業務判斷。
在為期9天如此密集的知識大爆炸中, 我們和“AI雙城記”的團員們一起,不僅和“機器之心”同頻共振,還與如此之多的“最強大腦”超距連接,大家都收獲到了什么?
敲黑板!敲黑板!以下是我們的隨行筆記,要劃重點了:
01
未來競爭的壁壘不再是算法,而是數據擁有的量和質。
從1950年代中期人工智能概念的第一次被提出,及至今天出現的三次人工智能浪潮,各類算法已趨近成型。而從應用層來看,監督學習、遷移學習、非監督學習、強化學習這四類算法所創造的經濟效益是遞減的,就目前而言,AI技術做出的經濟貢獻幾乎都來自第一種:監督學習,也就是讓機器學會從A到B,從輸入到輸出的映射。它依靠結構化數據,確實比非結構化數據創造了更多的經濟效益,并且已經擴展到在線廣告、消費金融、語音交互、機器翻譯等應用場景中。
此次拜訪的多位AI大牛都談到,當算法模型的優劣已不再是關鍵差異(就像所有安卓手機都系出安卓平臺),未來科技公司在AI應用上的較量更多取決于誰擁有更多、更好的數據。以及,怎么策略性地持續獲取更多數據。
如此圖所示,處于金字塔頂端的結構化數據,將是任何一家公司的寶藏。
02
建立數據獲取和訓練的飛輪,對手就很難追趕你。
在此行“AI雙城記”中,創業者向谷歌云機器學習與人工智能首席科學家李飛飛教授提出了這樣一個問題:大公司毫無疑問擁有巨大的數據獲取優勢,那么創業公司還有機會嗎?
李飛飛的回答是,大公司在獲取跟自己產品相關的數據方面,這一優勢肯定是無法匹及的。但是,AI應用的場景是多種多樣的,在許多領域還有待開掘。對于初創公司來說,怎么通過產品來撬動數據獲取才是最重要的。
吳恩達也持同樣觀點。他在白板上一邊畫圖一邊解釋:一家新公司需要特地設計一個循環:先為算法收集足夠的數據,這樣就能推出產品;然后通過這個產品來獲取用戶,而用戶會提供更多的數據……啟動了這一飛輪后,對手就很難追趕你。
以今日頭條為例。今日頭條副總裁、人工智能實驗室負責人馬維英在分享中亦提到,用戶使用今日頭條越多,會發現它越智能。原因就是,用戶會在使用時不斷喂給機器第二輪大數據:他的偏好、點擊次數、停留時長、負向反饋……從而讓頭條更懂用戶。
就如同互聯網時代已經發生過的故事那樣:大平臺之外,還有諸多垂直細分的數據領域有待挖礦。
03
大數據不追求因果性,更追求相關性。
原因是,只依據統計數據是不足以得出變量之間的因果性的。想要得出因果性,必須從理論上證明兩個變量之間確實有邏輯上的因果性,并且要排除掉第三個隱含變量同時影響這兩個變量的可能性。就像著名的啤酒尿布的故事,它只是說明這兩項商品的購買人群中存在較大概率的重合度。
正如“AI雙城記”團員、唯品會美國研發中心總經理、AI負責人謝楠在分享中提到AI 技術有幾大趨勢:算法“開源化”,計算“云服務化”,數據“私有化”。因此,就算法、數據和運算能力這三大 AI 要素來說,企業最需要建立起壁壘的是數據。AI的商業應用與學術論文研究有所不同,算法模型的準確率不必是唯一的研發目標。在有限的時間與資源的情況下,也許有商業ROI 更高的研發目標,譬如算法對某業務場景的覆蓋范圍。在特定的應用場景中,80%的算法模型準確率可能就可以做很多過去做不到的事情。如何在不完美準確率的情況下構建一個可行的商用場景是真正挑戰商業AI實踐者的地方,需要對業務及客戶需求有深刻的洞察與理解。
04
傳統科技公司 + 機器學習/神經網絡 ≠ AI公司。
吳恩達分享的主題就是:當AI成為新的電力,它將怎樣改變世界?