人工智能和Stuart Russell的控制問(wèn)題

2020-01-25 11:26:13    來(lái)源:    作者:

斯圖爾特·拉塞爾(Stuart Russell)是AI的真正開(kāi)拓者之一,數十年來(lái)一直處于該領(lǐng)域的最前沿。他的專(zhuān)業(yè)知識和前瞻性思想在他的最新作品《人類(lèi)兼容:人工智能與控制問(wèn)題》中達到了高潮。書(shū)是一塊基石,沿著(zhù)超級智能和生命3.0,即闡明了文明的尺度問(wèn)題,我們面臨著(zhù)人類(lèi)的目標和價(jià)值觀(guān)對準機器智能的。這不僅是對AI對齊問(wèn)題的進(jìn)一步闡述和發(fā)展,而且Stuart還提出了一種新穎的解決方案,使我們可以更好地理解創(chuàng )建有益的機器智能所需要的東西。

人工智能和Stuart Russell的控制問(wèn)題

“我認為大約在2013年,確實(shí)讓我感到震驚的是,實(shí)際上我們一直在以錯誤的方式思考AI。我們建立整個(gè)領(lǐng)域的方式基本上是一種人類(lèi)智慧的復制品,因為如果人類(lèi)的行動(dòng)達到了目標,那么人類(lèi)就是聰明的。因此,如果機器的動(dòng)作實(shí)現了目標,則該機器應該是智能的。然后,我們當然必須以獎勵函數或成本函數或邏輯目標陳述的形式提供目標。這一點(diǎn)可行。當機器很笨時(shí),它可以工作。而且,如果您提供了錯誤的目標,則可以重置它們并修復目標,并希望這次機器所做的工作實(shí)際上對您有所幫助。但是如果機器比人類(lèi)更智能,那么給他們錯誤的目標,基本上就是在人類(lèi)和機器之間建立起國際象棋比賽,而該機器的目標卻與我們自己的目標相違背。而且我們不會(huì )贏(yíng)得那場(chǎng)象棋比賽。”

人工智能和Stuart Russell的控制問(wèn)題

“因此,當一個(gè)人給另一個(gè)人一個(gè)目標時(shí),很顯然這不是唯一的人生使命。因此,您要求某人取咖啡,這并不意味著(zhù)不惜一切代價(jià)取咖啡??傮w而言,這只是意味著(zhù)我寧愿喝咖啡,但要知道,不要殺任何人來(lái)喝咖啡。不要清空我的銀行帳戶(hù)來(lái)喝咖啡。不要在沙漠上跋涉300英里以獲得咖啡。在A(yíng)I的標準模型中,機器對此一無(wú)所知。它只具有目標,這是生活中唯一的目的。更一般的模型是機器了解人的內部具有某種整體的偏好結構,這個(gè)特定的目標用來(lái)取咖啡或帶我去機場(chǎng)只是一個(gè)局部的體現。機器的目的應該是幫助人們以最佳的方式實(shí)現他們的整體偏好結構。如果目前碰巧包括喝杯咖啡,那就太好了,或者帶他去了機場(chǎng)。但是,機器始終知道并且不完全了解這種更大的首選項結構。一種思考的方式是說(shuō)AI的標準模型假設機器對目標具有完備的知識,而我提出的模型則假設該模型對目標具有不完善的知識或對目標的部分知識。因此,這絕對是更一般的情況。”

人工智能和Stuart Russell的控制問(wèn)題

“目標是重新定位AI領(lǐng)域,以便將來(lái)我們使用與標準模型不一樣的風(fēng)險來(lái)構建系統……這就是我認為對于A(yíng)I社區來(lái)說(shuō),這是我們存在的第一步。結束,我們需要繼續采用這種其他方式。因為這是隨著(zhù)機器變得更加智能化的唯一途徑。我們不能忍受標準模型,因為正如我所說(shuō),目標不正確的系統可能會(huì )帶來(lái)任意不良后果。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。