當今的AI系統似乎就像是智力強國,能夠在各種各樣的任務(wù)上擊敗人類(lèi)同行。但是,實(shí)際上,當今最先進(jìn)的AI代理的智力能力是有限的。以AlphaGo為例。盡管它可能是棋盤(pán)游戲Go的世界冠軍,但這實(shí)際上是系統擅長(cháng)的唯一任務(wù)。

當然,還有AlphaZero。該算法掌握了許多不同的游戲,從日本和美國的國際象棋到Go。因此,它比許多當代的AI代理更具能力和活力。但是,AlphaZero無(wú)法輕松將其智能應用于任何問(wèn)題。它不能像人類(lèi)一樣不受限制地從一項任務(wù)轉移到另一項任務(wù)。
可以對所有其他當前的AI系統說(shuō)同樣的話(huà)-它們的認知能力是有限的,并且不會(huì )超出其創(chuàng )建任務(wù)的范圍。這就是為什么人工智能(AGI)是許多研究人員的長(cháng)期目標的原因。
AGI系統被廣泛認為是AI研究的“圣杯”,它是具有廣泛?jiǎn)?wèn)題解決能力的人工智能代理,可幫助他們解決設計階段未曾考慮過(guò)的挑戰。與專(zhuān)注于一種特定技能的傳統AI系統不同,AGI系統將能夠有效地解決他們遇到的任何問(wèn)題,從而完成各種各樣的任務(wù)。

如果該技術(shù)得以實(shí)現,它將以無(wú)數種方式使人類(lèi)受益。斯坦福大學(xué)的經(jīng)濟學(xué)家馬歇爾·伯克(Marshall Burke)預測,AGI系統最終將能夠建立大規模的協(xié)調機制,以幫助緩解(甚至消除)我們最緊迫的問(wèn)題,例如饑餓和貧困。但是,在社會(huì )獲得這些AGI系統的好處之前,DeepMind的AGI安全研究員Ramana Kumar指出,人工智能設計師最終將需要解決自我完善的問(wèn)題。
自我完善符合AGI
當前的AI系統中已經(jīng)存在早期自我完善的形式。Kumar解釋說(shuō):“在正常的機器學(xué)習過(guò)程中會(huì )發(fā)生一種自我提升。”“也就是說(shuō),該系統提高了在訓練過(guò)程中很好地執行一項任務(wù)或一組任務(wù)的能力。”
但是,Kumar斷言,他會(huì )將這種形式的機器學(xué)習與真正的自我完善區分開(kāi)來(lái),因為該系統無(wú)法從根本上將其自身的設計更改為新的東西。為了實(shí)現重大改進(jìn)(包括新技能,新工具或創(chuàng )建更高級的AI代理),當前的AI系統需要人為他們提供新的代碼和新的訓練算法等。
然而,從理論上講,創(chuàng )建一個(gè)能夠真正自我完善的AI系統是可行的,Kumar指出,這種自我完善的機器是通向AGI的更可行途徑之一。
研究人員認為,自我完善的機器最終可能會(huì )導致AGI,因為這一過(guò)程被稱(chēng)為“遞歸自我完善”?;舅枷胧?,隨著(zhù)AI系統繼續使用遞歸自我完善來(lái)提高自身智能程度,它會(huì )變得越來(lái)越好,在使自己更聰明。這將迅速導致其情報呈指數級增長(cháng),并最終導致AGI。

庫瑪說(shuō),這種情況是完全合理的,并解釋說(shuō):“要使這種方法可行,我們需要幾個(gè)幾乎沒(méi)有爭議的假設:理論上存在這樣的高能代理,可以通過(guò)一系列局部改進(jìn)來(lái)找到它們。”從這個(gè)意義上說(shuō),遞歸自我完善是許多理論的核心,這些理論涉及如何從當今的中度智能機器轉變?yōu)槌悄蹵GI。但是,庫瑪(Kumar)澄清說(shuō),這不是通往AI超智能的唯一潛在途徑。
人類(lèi)可以發(fā)現如何通過(guò)各種方法來(lái)構建功能強大的AGI系統。這可能“通過(guò)擴大現有的機器學(xué)習方法來(lái)實(shí)現,例如使用更快的硬件?;蛘呖梢酝ㄟ^(guò)在表示學(xué)習,轉移學(xué)習,基于模型的強化學(xué)習或其他方向上進(jìn)行增量研究來(lái)實(shí)現。例如,我們可能會(huì )在大腦掃描和仿真方面取得足夠的進(jìn)步,以復制和加速特定人的智力。”
