AI研究人員已經(jīng)開(kāi)始使用它來(lái)訓練和測試各種AI系統

2019-08-30 17:07:52    來(lái)源:人工智能網(wǎng)    作者:

從玩游戲到人臉識別,機器智能在一系列任務(wù)上的表現都超過(guò)了人類(lèi)。但令人尷尬的事實(shí)是,AI系統仍然無(wú)法處理多項任務(wù)。AI研究人員的下一個(gè)大目標是開(kāi)發(fā)一個(gè)能很好地完成很多任務(wù)的系統,而不是只擅長(cháng)一項任務(wù)的超級人類(lèi)。

Facebook Research的Arthur Szlam和同事們進(jìn)入了這一領(lǐng)域,他們已經(jīng)開(kāi)始研究的AI助理能夠和人類(lèi)互動(dòng),然后根據請求執行各種任務(wù)。至關(guān)重要的是,這些助理可以從互動(dòng)中學(xué)習,從而增加其執行任務(wù)的范圍。

Szlam及其同事選擇通過(guò)《我的世界》來(lái)實(shí)現這一目標。這是一款3D沙盒視頻游戲,允許玩家在一個(gè)獨特的、無(wú)限的在線(xiàn)世界中探索、構建、制作甚至戰斗。

《我的世界》是有史以來(lái)最暢銷(xiāo)的電子游戲,已售出超過(guò)1.7億份。每月有超過(guò)9000萬(wàn)人在參與這個(gè)游戲。

但讓它對AI研究有用的是,盡管《我的世界》提供了無(wú)限的多樣性,但它的規則也很簡(jiǎn)單,在一定范圍內是可預測的。AI研究人員已經(jīng)開(kāi)始使用它來(lái)訓練和測試各種AI系統。

現在,Szlam和他的同事正在更進(jìn)一步發(fā)展。他們表示:“我們感興趣的不是在單個(gè)困難任務(wù)上的超人表現,而是在大量更簡(jiǎn)單任務(wù)上的能力,而這些任務(wù)是由人類(lèi)指定的。”

《我的世界》是AI向人類(lèi)學(xué)習的完美環(huán)境。他們說(shuō)道:“由于我們是在游戲環(huán)境中工作的,玩家可能喜歡在開(kāi)發(fā)過(guò)程中與助手進(jìn)行互動(dòng),這為人類(lèi)參與到的環(huán)形研究提供了豐富的資源。”

乍一看,《我的世界》中可能出現的行動(dòng)數量是巨大的。Szlam和同事表示:“一個(gè)玩家在游戲中可能做的事情是非常多的;最天真的是,涉及所有區塊的可行方法需要占據所有的內存。”

但《我的世界》中的絕大多數區塊布置都是不太可能的。他們表示:“我們預計,助理玩家請求的布置將集中在游戲中實(shí)際可能的一小部分。”

這使得AI的任務(wù)變得簡(jiǎn)單得多。Facebook團隊認為,即使他們的AI系統在很多任務(wù)上失敗了,它仍然是有用的。他們表示:“我們相信,我們可以在成為一名有用的助理方面取得進(jìn)展,而不必能夠成功應對每一個(gè)可能的請求。”

但這仍然具有挑戰性。困難之一是理解普通語(yǔ)言。Facebook團隊設想了以下要求:

玩家:建造一座15個(gè)區塊高的塔樓,然后在上面放上一個(gè)巨大的笑臉。

助理:好的。

這個(gè)相對簡(jiǎn)單的要求需要大量的知識。助理必須理解“塔”的概念和如何建造一座塔,知道“15個(gè)區塊高”是測量塔的高度,知道“15”是什么。它還需要理解“笑臉”這個(gè)詞,以及如何構建它,并知道將它放在“頂部”意味著(zhù)什么。不難想象這些請求會(huì )變得多么復雜。

但AI學(xué)習的機會(huì )是巨大的。如果Facebook能夠獲得足夠多的人類(lèi)幫助,那么這個(gè)助理就可以要求人類(lèi)幫助它學(xué)習。

而Facebook正在把設計AI的任務(wù)設定為自我完善。對AI系統最常見(jiàn)的批評之一是,它們除了接受過(guò)收集準備好的數據所提供的訓練外,沒(méi)有學(xué)到新的任務(wù)。但研究者認為,《我的世界》環(huán)境是發(fā)展這種學(xué)習的理想環(huán)境。

這是一項有趣的工作,為Facebook制定了一個(gè)雄心勃勃的目標。當然,現在還為時(shí)尚早。該團隊將這項工作描述為“戰斗的召喚”。

不過(guò),該助理的早期版本已經(jīng)可供普通用戶(hù)開(kāi)始試用,任何人都可以下載。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。