長(cháng)期以來(lái),游戲一直被用作人工智能的試驗臺和基準,近幾個(gè)月來(lái),成就不乏不足。谷歌DeepMind的AlphaGo和卡內基梅隆大學(xué)的撲克機器人Libratus在傳統上對AI很難的游戲中都擊敗了人類(lèi)專(zhuān)家-在IBM的DeepBlue 在國際象棋上取得了同樣的成就大約20年之后。

這樣的游戲具有明確定義的規則的吸引力。它們對于A(yíng)I研究人員來(lái)說(shuō)相對簡(jiǎn)單且便宜,并且以任何期望的難度提供了各種認知挑戰。通過(guò)發(fā)明可以發(fā)揮作用的算法,研究人員希望能夠深入了解自動(dòng)運行所需的機制。
隨著(zhù)AI和機器學(xué)習的最新技術(shù)的到來(lái),現在的注意力已轉移到視覺(jué)上詳細的計算機游戲上,包括3-D射擊游戲Doom,各種2-D Atari游戲(例如Pong和Space Invaders)以及實(shí)時(shí)策略。游戲《星際爭霸》。
這當然是所有的進(jìn)步,但是更大的AI畫(huà)面的關(guān)鍵部分卻被忽略了。研究?jì)?yōu)先考慮了游戲,在這些游戲中,預先知道可以執行的所有動(dòng)作,無(wú)論是移動(dòng)騎士還是發(fā)射武器。從一開(kāi)始就為計算機提供了所有選項,重點(diǎn)是在它們之間進(jìn)行選擇的程度。問(wèn)題在于,這使AI研究脫離了使計算機真正具有自主性的任務(wù)。
香蕉皮
讓計算機確定在給定背景下甚至存在的動(dòng)作提出了概念和實(shí)際挑戰,到目前為止,游戲研究人員幾乎沒(méi)有嘗試解決這些挑戰。“猴子和香蕉”問(wèn)題是一個(gè)長(cháng)期以來(lái)人工智能難題的例子,其中最近沒(méi)有取得任何進(jìn)展。
這個(gè)問(wèn)題最初是由AI的創(chuàng )始者之一約翰·麥卡錫(John McCarthy)在1963年提出的:一個(gè)房間里有一張椅子,一根棍子,一只猴子和一堆香蕉掛在天花板上。任務(wù)是讓計算機提出一系列動(dòng)作,使猴子能夠獲取香蕉。
麥卡錫在人工智能方面區分了該任務(wù)的兩個(gè)方面。物理可行性–確定特定的動(dòng)作序列在物理上是否可以實(shí)現;以及與認識論或知識相關(guān)的可行性–確定猴子實(shí)際上可能采取的行動(dòng)。

如果事先告知所有可能的動(dòng)作–“爬上椅子”,“波浪棒”等,對于計算機來(lái)說(shuō),確定對猴子來(lái)說(shuō)在物理上可行的方法非常容易。一個(gè)簡(jiǎn)單的程序指示計算機逐個(gè)執行所有可能的操作順序,將迅速獲得最佳解決方案。
但是,如果計算機必須首先確定甚至可以執行哪些操作,則將面臨更大的挑戰。它提出了關(guān)于我們如何表示知識,知道某物的必要條件和充分條件以及我們如何知道何時(shí)獲得足夠知識的問(wèn)題。在強調這些問(wèn)題時(shí),麥卡錫說(shuō):“我們的最終目標是使程序像人類(lèi)一樣有效地學(xué)習經(jīng)驗。”
除非計算機在未對可能的操作進(jìn)行任何預先描述的情況下解決問(wèn)題,否則就無(wú)法實(shí)現此目標。不幸的是,AI研究人員忽略了這一點(diǎn):不僅這些問(wèn)題變得更加困難和有趣,而且它們看起來(lái)像是在該領(lǐng)域取得更有意義進(jìn)展的前提。
文字申訴
為了在復雜的環(huán)境中自主運行,不可能預先描述如何最好地操縱甚至表征那里的物體。教計算機克服這些困難會(huì )立即引發(fā)有關(guān)從以前的經(jīng)驗中學(xué)習的深刻問(wèn)題。
與其專(zhuān)注于可以避免這個(gè)問(wèn)題的Doom或StarCraft之類(lèi)的游戲,不如對現代AI進(jìn)行更有希望的測試,可能是1970年代和1980年代的不起眼的文字冒險。
在計算機具備復雜的圖形功能之前的日子,像Colossal Cave和Zork這樣的游戲很流行。屏幕上的消息告訴玩家他們的環(huán)境:
他們必須以簡(jiǎn)單的指令做出響應,通常以動(dòng)詞或動(dòng)詞加名詞的形式進(jìn)行響應–“ look”,“ take box”等。挑戰的一部分是弄清楚哪些行動(dòng)是可能的和有用的,并做出相應的響應。
對于現代AI來(lái)說(shuō),一個(gè)很好的挑戰是在這樣的冒險中扮演玩家的角色。計算機將不得不理解屏幕上的文本描述,并使用某種預測機制來(lái)確定其可能的效果,并通過(guò)動(dòng)作對它們進(jìn)行響應。
計算機上更復雜的行為包括探索環(huán)境,定義目標,做出面向目標的動(dòng)作選擇以及解決通常需要進(jìn)行的各種智力挑戰。
由IBM,Google,Facebook或Microsoft之類(lèi)的技術(shù)巨頭推廣的現代AI方法在這些文字冒險中的表現如何是一個(gè)懸而未決的問(wèn)題–每個(gè)新場(chǎng)景他們將需要多少專(zhuān)業(yè)的人類(lèi)知識。

為了衡量該領(lǐng)域的進(jìn)展,過(guò)去兩年來(lái),我們一直在今年 8月在荷蘭馬斯特里赫特舉行的IEEE計算智能和游戲大會(huì )上進(jìn)行競賽。參賽者需要提前提交參賽作品,并且可以使用自己選擇的AI技術(shù)來(lái)構建程序,以通過(guò)理解文字描述并輸出適當的文字命令來(lái)玩這些游戲。
簡(jiǎn)而言之,如果AI要保持進(jìn)步,研究人員需要重新考慮他們的優(yōu)先事項。如果發(fā)現該學(xué)科被忽視的根源是富有成果的,那只猴子畢竟可能最終得到了他的香蕉。
