谷歌母公司Alphabet旗下的DeepMind過(guò)去一年損失總額達5.72億美元

2019-08-30 17:03:19    來(lái)源:人工智能網(wǎng)    作者:

谷歌母公司Alphabet旗下的DeepMind過(guò)去一年損失總額達5.72億美元。作為全球規模最大的人工智能學(xué)術(shù)研究機構之一,DeepMind在過(guò)去三年中始終虧損,累計金額已超10億美元。在未來(lái)12個(gè)月內,DeepMind還需要繼續投入超過(guò)10億美元。

這是否意味著(zhù)AI技術(shù)正在走向崩潰?

這不一定。研究活動(dòng)本來(lái)就相當燒錢(qián),與一系列最頂尖的科學(xué)項目相比,DeepMind的支出只能算是“九牛一毛”。歐洲的大型強子對撞機項目每年光是維護成本就高達10億美元,最終發(fā)現希格斯玻色子的總成本估計將超過(guò)100億美元。而且,人們印象中的真正人工智能(也被稱(chēng)為人工通用智能,簡(jiǎn)稱(chēng)AGI)這類(lèi)既能玩轉《星際迷航》、又能聽(tīng)懂人類(lèi)表達的重量級成果,開(kāi)出的價(jià)碼也絕對不會(huì )便宜。

即便如此,DeepMind逐年上升的虧損水平仍然值得關(guān)注:2016年,DeepMind虧損額為1.54億美元;2017年增長(cháng)至3.41億美元;2018年則進(jìn)一步提升至5.72億美元。在筆者看來(lái),這其中包含著(zhù)三大核心問(wèn)題:

DeepMind是否找到了正確的科學(xué)探索方向?

從Alphabet的角度來(lái)看,這樣的投入規模是否合理?

如此可觀(guān)的虧損數字,又會(huì )給整個(gè)AI市場(chǎng)帶來(lái)怎樣的影響?

首先來(lái)看探索方向的問(wèn)題。之所以值得討論,是因為DeepMind明顯是把雞蛋都放進(jìn)了同一個(gè)籃子——也就是深度強化學(xué)習。這項技術(shù)主要用于通過(guò)模型識別將深度學(xué)習與強化學(xué)習加以結合,基于獎勵信號實(shí)現學(xué)習能力,從而使系統學(xué)會(huì )如何在游戲中獲得更高分數、或者在象棋等游戲中對抗求勝。

DeepMind的成名之作是2013年發(fā)表的一篇論文。這篇令人振奮的成果闡述了如何對單一神經(jīng)網(wǎng)絡(luò )系統進(jìn)行訓練,以教會(huì )其游玩多款雅達利游戲(包括〈突圍〉以及〈太空入侵者〉),并最終獲得近似甚至超越人類(lèi)的成績(jì)。這篇論文讓DeepMind成了AI領(lǐng)域的搖滾巨星,并成功引起谷歌方面的注意。在2014年1月被谷歌收購之后,DeepMind進(jìn)一步推動(dòng)技術(shù)開(kāi)發(fā),先后在圍棋以及不朽神作《星際爭霸》游戲中接連取得勝利。

但問(wèn)題在于,這項技術(shù)對環(huán)境有著(zhù)非常具體甚至可以說(shuō)是苛刻的要求。例如在游玩《突圍》時(shí),哪怕是一丁點(diǎn)微小的變化,例如將鏡頭對焦位置移動(dòng)幾個(gè)像素點(diǎn),其性能都會(huì )受到巨大影響。DeepMind的《星際爭霸》系統同樣局限性明顯:在同一地圖內使用同一種族進(jìn)行對戰,其成功確實(shí)足以超越人類(lèi);但在其它地圖使用另一種族時(shí),成績(jì)就會(huì )快速下滑。要轉換作戰風(fēng)格,我們必須從頭開(kāi)始重新進(jìn)行系統訓練。

從某種程度上講,深度強化學(xué)習是一種經(jīng)過(guò)增強的記憶系統;它在某些場(chǎng)景中確實(shí)擁有良好表現,但對工作內容的理解程度卻非常有限。因此,這類(lèi)系統沒(méi)什么靈活性可言,無(wú)法即時(shí)根據環(huán)境變化做出調整,并最終導致極微小的變化都會(huì )顯著(zhù)影響實(shí)際性能。(DeepMind最近公布的腎病檢查方案,也因為類(lèi)似的問(wèn)題而遭到質(zhì)疑。)

深度強化學(xué)習同時(shí)需要大量數據作為支持——例如在學(xué)習圍棋時(shí),需要完成數百萬(wàn)盤(pán)自我對局才能掌握個(gè)人奧妙。很明顯,人類(lèi)棋手不需要也不可能完成如此龐大的訓練量,而且這樣的過(guò)程難度極高且成本極巨,只有谷歌這樣的科技巨頭才能負擔得起恐怖的計算資源需求。換言之,絕大多數企業(yè)與客戶(hù)根本不可能在自己孱弱的獨立計算機上實(shí)現類(lèi)似的現實(shí)問(wèn)題解決能力。根據估算,AphaGo的整個(gè)訓練周期耗資達3500萬(wàn)美元,其消耗的能量足以支持12760個(gè)人連續三天不停進(jìn)行腦力勞動(dòng)。

以上討論的只是經(jīng)濟問(wèn)題。更重要的是,正如Ernest Davis和筆者在即將出版的《Robboting AI》一書(shū)中提到,我們能否信任現有AI方案。目前,深度強化學(xué)習只能在良好可控的環(huán)境下提供可靠的結果;這樣的局限對于圍棋這種兩千年來(lái)沒(méi)怎么發(fā)生變化的場(chǎng)景非常適用,但我們顯然不敢貿然把它引入到其它現實(shí)問(wèn)題當中。

>>> 難以實(shí)現商業(yè)應用

之所以難以商業(yè)應用,主要是因為目前大多數實(shí)際問(wèn)題都不像游戲那樣擁有嚴格的場(chǎng)景與條件。也正因為如此,DeepMind目前仍拿不出比較像樣的深度強化學(xué)習商業(yè)方案。與此同時(shí),Alphabet已經(jīng)在DeepMind身上燒掉了約20億美元(包括2014年收購DeepMind的6.5億美元)。但除了賺到的好名聲之外,DeepMind在過(guò)去一年中只帶來(lái)了約1.25億美元的實(shí)際收入,其中相當一部分為Alphabet內部利用深度強化學(xué)習技術(shù)降低冷卻成本省下的電費。

而且在圍棋領(lǐng)域大顯身手的技能,也很難解決其它挑戰性問(wèn)題——例如癌癥與清潔能源。這類(lèi)狀況早已有之:IBM公司的Watson曾在問(wèn)答節目當中一鳴驚人,但卻一直無(wú)法成功進(jìn)軍醫學(xué)診斷領(lǐng)域。雖能夠在某些病例中提供良好表現,但Watson在另一些病例中卻慘遭失敗,甚至還曾經(jīng)在心臟病發(fā)作癥狀的判斷上犯錯——要知道,這可是醫學(xué)新生都能準確判斷的病癥。

當然,時(shí)間也許能夠解決這個(gè)難題。至少自2013年以來(lái),DeepMind就一直在努力研究深度強化學(xué)習技術(shù),而且科技進(jìn)步也向來(lái)難以快速轉化為實(shí)際產(chǎn)品。DeepMind以及其它研究機構,最終也許能夠找到一種可行的方式,促進(jìn)深度強化學(xué)習帶來(lái)更穩定也更契合任務(wù)內容的結果;又或者,這項技術(shù)未來(lái)能夠與其它技術(shù)結合起來(lái),迸發(fā)出新的能量。也許深度強化學(xué)習最終能夠像當年的晶體管一樣,成為一種徹底改變世界的實(shí)驗室發(fā)明,也有可能永遠停留在探索階段,僅僅作為人類(lèi)不斷探索真理的道路上的又一塊鋪路石。但無(wú)論如何,筆者個(gè)人猜測最終結果可能介于這兩者之間——有用而且廣泛存在,但又不足以改變整個(gè)世界。

雖然DeepMind目前的成果沒(méi)能完全符合人們的期待,相信也不會(huì )有人對其妄加指摘。深度強化學(xué)習不一定是通往人工通用智能的正確道路,但這絲毫不妨礙DeepMind自身的偉大——這仍是一個(gè)運營(yíng)嚴密、資金充裕而且人才濟濟的機構。而且如果接下來(lái)AI的發(fā)展方向有所變化,DeepMind也一定會(huì )是能夠迅速抓住機會(huì )的參與者之一。就目前來(lái)看,能夠與DeepMind相抗衡的研究機構仍然屈指可數。與此同時(shí),Alphabet也是一家財力雄厚的企業(yè),對他們來(lái)說(shuō)一年5億美元也不是啥大問(wèn)題。Alphabet公司曾非常英明地決定投資AI技術(shù),其中包括目前同樣在快速成長(cháng)的Google Brain項目。Alphabet方面可能會(huì )通過(guò)多種途徑調整自家AI方案的組合方式,不過(guò)考慮到這是一家年收入高達1000億美元的行業(yè)巨頭,而且旗下搜索服務(wù)及廣告推薦等大部分業(yè)務(wù)都依賴(lài)于A(yíng)I技術(shù),相信他們有能力也有理由繼續支持這些重量級研發(fā)項目。

>>> 過(guò)度炒作難題

關(guān)于最后一個(gè)問(wèn)題,我們目前還很難判斷DeepMind的經(jīng)濟狀況會(huì )給整個(gè)AI市場(chǎng)帶來(lái)怎樣的影響。如果交付的成果完全跟不上當初的炒作宣傳,那么“人工智能寒冬”也許終將來(lái)臨,甚至導致原本的支持者失去信心而停止投入。另外,如果DeepMind在未來(lái)幾年中的虧損額繼續一路飆升,恐怕Alphabet自己也有可能被迫退出。畢竟到目前為止,DeepMind還是拿不出像樣的財報數據,時(shí)間久了投資者難免要重新思考自己對于A(yíng)I技術(shù)抱持的立場(chǎng)。

同樣麻煩纏身的,遠不只是DeepMind。無(wú)論是無(wú)人駕駛汽車(chē)還是能夠順暢理解人類(lèi)語(yǔ)言的聊天機器人,這些幾年前被炒得火熱的概念至今仍然沒(méi)有實(shí)現。Mark Zuckerberg在2018年4月的美國國會(huì )聽(tīng)證會(huì )上曾保證,虛假新聞問(wèn)題很快就會(huì )在A(yíng)I技術(shù)面前土崩瓦解。但是情況顯然沒(méi)這么簡(jiǎn)單,這也使得整個(gè)社會(huì )對于A(yíng)I技術(shù)的看法變得愈發(fā)保守——不信承諾,信“療效”。

至少就當下看,人工通用智能還只是個(gè)目標,距離真正落地還有很長(cháng)的路。雖然AI技術(shù)在廣告及語(yǔ)音識別等一部分領(lǐng)域取得良好進(jìn)展,但必須承認,AI發(fā)展還遠稱(chēng)不上成熟。但在另一方面,我們也要認可AI在大數據分析領(lǐng)域的強大能力;而且哪怕只是當前的水平,AI也已經(jīng)是一種卓越的技術(shù)工具。因此即使未來(lái)企業(yè)不再傾力投入,AI的研究與發(fā)展也絕對不會(huì )沉寂下去。

>>> 預測未來(lái)

在筆者看來(lái),十年之后我們可能會(huì )得出結論,發(fā)現深度強化學(xué)習的意義其實(shí)被高估了。這也使得其它不少真正重要的研究方向遭到忽視。畢竟在強化學(xué)習領(lǐng)域投入的第一塊錢(qián),都代表著(zhù)其它研發(fā)經(jīng)費的縮減——例如對于人類(lèi)認知科學(xué)的研究。當下,很多機器學(xué)習研究人員都在問(wèn),“機器如何利用大量數據優(yōu)化復雜問(wèn)題?”但我們真正應該關(guān)心的,其實(shí)是“為什么孩子們用不著(zhù)那么多數據和那么復雜的處理流程,就能掌握自然語(yǔ)言并理解現實(shí)世界?”如果我們能在后一個(gè)問(wèn)題上多花點(diǎn)時(shí)間、資金和精力,也許人工通用智能的來(lái)臨還能更早一些。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。