在機器人中重現不同動(dòng)物運動(dòng)技能的系統

2020-05-02 12:54:01    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻

Google Research和加州大學(xué)伯克利分校的研究人員最近開(kāi)發(fā)了一種模仿學(xué)習系統,可以在機器人中實(shí)現各種敏捷的運動(dòng)行為。他們的技術(shù)發(fā)表在arXiv上的一篇論文中,該技術(shù)使機器人可以通過(guò)模仿動(dòng)物來(lái)獲得新技能。

在機器人中重現不同動(dòng)物運動(dòng)技能的系統

進(jìn)行這項研究的研究人員之一賈森·彭(Jason Peng)對TechXplore表示:“該項目建立在計算機圖形學(xué)的一些先前作品的基礎上,該圖形學(xué)通過(guò)模仿人體運動(dòng)捕捉數據來(lái)訓練模擬角色進(jìn)行移動(dòng)。” “這些技術(shù)大多數主要用于仿真,但是在我們最近的項目中,我們邁出了將其應用于真實(shí)機器人的第一步。”

Peng和他的同事最初訓練了四足機器人,以模仿狗在模擬環(huán)境中的運動(dòng)和行走方式。他們的系統使用稱(chēng)為強化學(xué)習的方法接受了從真實(shí)狗身上記錄的運動(dòng)數據的訓練。

Peng解釋說(shuō):“模擬訓練的優(yōu)點(diǎn)之一是它非???,因此我們可以在幾天之內模擬數月的訓練。” “一旦對機器人進(jìn)行了模擬訓練,我們就可以使用在現實(shí)世界中收集到的幾分鐘數據,將其學(xué)到的東西應用于真正的機器人。”

Peng和他的同事采用的模仿學(xué)習方法比設計機器人控制器的傳統技術(shù)更具擴展性。實(shí)際上,與其為一個(gè)機器人試圖復制的每種技能設計一種新的控制器,他們的方法還可以通過(guò)向動(dòng)物展示一些動(dòng)物執行期望動(dòng)作的示例,簡(jiǎn)單地訓練機器人以實(shí)現特定的運動(dòng)風(fēng)格。然后,機器人只需觀(guān)察這些示例即可自動(dòng)學(xué)習新的運動(dòng)技能。

在機器人中重現不同動(dòng)物運動(dòng)技能的系統

Peng和他的同事在一系列實(shí)驗中評估了他們的方法,訓練了18自由度四足機器人Laikago,以重現不同的動(dòng)物運動(dòng)行為,包括不同的奔跑,跳躍和轉彎方式。值得注意的是,他們的技術(shù)使機器人可以自動(dòng)合成各種動(dòng)物運動(dòng)風(fēng)格的控制器,從而將在模擬環(huán)境中學(xué)習到的技能有效地轉移到現實(shí)世界中。

“對我們來(lái)說(shuō),最令人興奮的結果是,相同的基礎方法可以學(xué)習從步行到動(dòng)態(tài)跳躍和轉彎的各種技能,并且在模擬中學(xué)習的所有技能也可以轉移到真正的機器人上,” Peng說(shuō)。“這些模仿學(xué)習技術(shù)可以使為機器人建立大量技能庫變得更加容易,從而使它們能夠與現實(shí)世界更加靈活地移動(dòng)和交互。”

將來(lái),Peng和他的同事開(kāi)發(fā)的模仿學(xué)習系統可以在受動(dòng)物啟發(fā)的機器人中實(shí)現更多種類(lèi)的敏捷動(dòng)作。目前,他們的技術(shù)只能使用運動(dòng)數據進(jìn)行訓練,但研究人員正在嘗試進(jìn)一步開(kāi)發(fā)它,以便它也可以從動(dòng)物視頻中學(xué)習。

Peng說(shuō):“我們現在有興趣嘗試讓機器人模仿不同種類(lèi)的運動(dòng)數據,例如視頻剪輯。” “運動(dòng)捕捉數據有時(shí)可能很難記錄,尤其是從動(dòng)物身上記錄下來(lái),因為把狗帶入Mocap工作室可能很棘手。如果我們只用手機記錄一些我們想要的機器人的視頻片段,那就太好了。然后讓機器人學(xué)習如何自動(dòng)重現這些技能。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。