麻省理工學(xué)院的研究人員發(fā)明了一種方法,可以有效地優(yōu)化用于目標任務(wù)的軟機器人的控制和設計,這在傳統上是一項艱巨的任務(wù)。
軟機器人具有彈性,柔性,可拉伸的主體,這些主體在任何給定時(shí)刻基本上可以移動(dòng)無(wú)數種方式。從計算上講,這表示一個(gè)非常復雜的“狀態(tài)表示”,它描述了機器人各部分的運動(dòng)方式。軟機器人的狀態(tài)表示可能具有數百萬(wàn)個(gè)維度,這使得很難計算出使機器人完成復雜任務(wù)的最佳方式。

在下個(gè)月的神經(jīng)信息處理系統會(huì )議上,麻省理工學(xué)院的研究人員將提出一個(gè)模型,該模型根據機器人及其環(huán)境的基本物理特性,學(xué)習緊湊的或“低維”的,詳細的狀態(tài)表示形式。 。這有助于模型迭代地優(yōu)化滿(mǎn)足特定任務(wù)的運動(dòng)控制和材料設計參數。
“軟機器人是無(wú)限維的生物,在任何給定的時(shí)刻都會(huì )以十億種不同的方式彎曲,”第一作者安德魯·斯皮爾伯格(Andrew Spielberg)說(shuō),他是計算機科學(xué)和人工智能實(shí)驗室(CSAIL)的研究生。“但是,實(shí)際上,軟物體可能會(huì )自然彎曲。我們發(fā)現可以在低維描述中非常緊湊地描述軟機器人的自然狀態(tài)。通過(guò)學(xué)習對可能狀態(tài)的良好描述,我們優(yōu)化了軟機器人的控制和設計。”
在仿真中,該模型使2D和3D軟機器人能夠比當前最新技術(shù)更快,更準確地完成任務(wù),例如移動(dòng)一定距離或到達目標位置。研究人員接下來(lái)計劃在真正的軟機器人中實(shí)施該模型。

CSAIL的研究生Allan Zhao,Tao Du和Huyuanming則是與Spielberg一同加入本文的人。CSAIL總監Daniela Rus以及電機工程和計算機科學(xué)系的Andrew and Erna Viterbi教授;麻省理工學(xué)院電氣工程和計算機科學(xué)副教授,計算制造小組負責人Wojciech Matusik。
“在環(huán)學(xué)習”
軟機器人技術(shù)是一個(gè)相對較新的研究領(lǐng)域,但它對高級機器人技術(shù)有希望。例如,柔性車(chē)身可以提供與人類(lèi)更安全的交互,更好的對象操縱和更大的可操縱性,以及其他好處。
在仿真中對機器人的控制依賴(lài)于一個(gè)“觀(guān)察者”,它是一個(gè)計算變量的程序,該變量可查看軟機器人如何移動(dòng)以完成任務(wù)。在先前的工作中,研究人員將軟機器人分解為手工設計的模擬粒子簇。粒子包含重要信息,有助于縮小機器人的可能運動(dòng)范圍。例如,如果機器人試圖以某種方式彎曲,則執行器可能會(huì )對該移動(dòng)進(jìn)行足夠的抵抗,以至于可以忽略不計。但是,對于這種復雜的機器人,在仿真過(guò)程中手動(dòng)選擇要跟蹤的集群可能很棘手。
在這項工作的基礎上,研究人員設計了一種“循環(huán)中學(xué)習優(yōu)化”方法,其中,所有優(yōu)化參數都是在多次模擬的單個(gè)反饋循環(huán)中學(xué)習的。而且,在學(xué)習優(yōu)化(或“在循環(huán)中”)的同時(shí),該方法還可以學(xué)習狀態(tài)表示。
該模型采用一種稱(chēng)為“材料點(diǎn)方法”(MPM)的技術(shù),該技術(shù)可模擬被背景網(wǎng)格包圍的連續材料(例如泡沫和液體)顆粒的行為。這樣,它無(wú)需任何額外的計算就可以將機器人的粒子及其可觀(guān)察的環(huán)境捕獲為像素或3D像素(稱(chēng)為體素)。
在學(xué)習階段,此原始粒子網(wǎng)格信息被饋送到機器學(xué)習組件,該組件學(xué)習輸入圖像,將其壓縮為低維表示,然后將表示解壓縮回輸入圖像。如果此“自動(dòng)編碼器”在壓縮輸入圖像時(shí)保留了足夠的細節,則可以從壓縮中準確地重新創(chuàng )建輸入圖像。

在研究人員的工作中,自動(dòng)編碼器學(xué)習到的壓縮表示形式用作機器人的低維狀態(tài)表示形式。在優(yōu)化階段,該壓縮表示形式將返回到控制器,該控制器將為機器人的每個(gè)粒子在下一個(gè)MPM模擬步驟中應如何運動(dòng)輸出計算出的驅動(dòng)力。
同時(shí),控制器使用該信息來(lái)調整每個(gè)粒子的最佳剛度,以實(shí)現其所需的運動(dòng)。將來(lái),該材料信息可能會(huì )用于3D打印軟機器人,在該3D打印軟機器人中,每個(gè)粒子點(diǎn)的打印硬度可能會(huì )略有不同。斯皮爾伯格說(shuō):“這允許根據機器人的動(dòng)作創(chuàng )建與特定任務(wù)相關(guān)的機器人設計。” “通過(guò)一起學(xué)習這些參數,您可以使所有內容盡可能地保持同步,從而使設計過(guò)程更加容易。”

優(yōu)化更快
依次將所有優(yōu)化信息反饋到循環(huán)的起點(diǎn),以訓練自動(dòng)編碼器。在許多模擬中,控制器學(xué)習最佳運動(dòng)和材料設計,而自動(dòng)編碼器學(xué)習越來(lái)越詳細的狀態(tài)表示。斯皮爾伯格說(shuō):“關(guān)鍵是我們希望低維狀態(tài)具有很好的描述性。”
機器人在設定的時(shí)間段內達到其模擬的最終狀態(tài)(例如,盡可能接近目標位置)后,將更新“損失函數”。這是機器學(xué)習的重要組成部分,它試圖最大程度地減少一些錯誤。在這種情況下,它可以使機器人距目標的距離最小化。該損失函數流回到控制器,該控制器使用誤差信號調整所有優(yōu)化的參數,以最好地完成任務(wù)。
斯皮爾伯格說(shuō),如果研究人員試圖將模擬的所有原始粒子直接送入控制器,而沒(méi)有壓縮步驟,則“運行和優(yōu)化時(shí)間將會(huì )激增”。使用壓縮表示,研究人員能夠將每次優(yōu)化迭代的運行時(shí)間從幾分鐘減少到大約10秒。
研究人員通過(guò)對各種2D和3D兩足動(dòng)物和四足機器人的仿真驗證了他們的模型。他們的研究人員還發(fā)現,雖然使用傳統方法的機器人最多可以進(jìn)行30,000個(gè)仿真來(lái)優(yōu)化這些參數,但是在模型上訓練的機器人僅進(jìn)行了約400個(gè)仿真。

“我們的目標是實(shí)現工程師從規格到軟機器人的設計,原型設計和編程的方式上的飛躍。在本文中,我們探索了共同優(yōu)化軟機器人的主體和控制系統的潛力,可以引領(lǐng)軟機器人的發(fā)展??焖賱?chuàng )建根據其任務(wù)定制的軟體機器人。” Rus說(shuō)。
將模型部署到實(shí)際的軟機器人中意味著(zhù)解決現實(shí)噪聲和不確定性問(wèn)題,這可能會(huì )降低模型的效率和準確性。但是,將來(lái),研究人員希望為軟機器人設計從仿真到制造的完整流水線(xiàn)。
分享
