這項聰明的技術(shù)可以幫助機器人識別和區分物體

2020-02-07 16:39:38    來(lái)源:    作者:

導航方法可以加快自主最后一英里的交付速度。

在不久的將來(lái),可能會(huì )派遣機器人作為最后一英里的送貨車(chē)輛,在您可以找到門(mén)時(shí),在您家門(mén)口放下您的外賣(mài)訂單,包裹或飯菜包。

這項聰明的技術(shù)可以幫助機器人識別和區分物體

機器人導航的標準方法包括提前繪制區域,然后使用算法將機器人引導至地圖上的特定目標或GPS坐標。盡管這種方法對于探索特定環(huán)境(例如特定建筑物的布局或計劃的障礙物路線(xiàn))可能很有意義,但在最后一英里交付的情況下可能變得笨拙。

例如,想象一下,必須預先繪制機器人交付區域內的每個(gè)鄰居,包括該鄰居內每個(gè)房子的配置以及每個(gè)房子前門(mén)的特定坐標。這樣的任務(wù)可能難以擴展到整個(gè)城市,尤其是隨著(zhù)房屋的外觀(guān)經(jīng)常隨季節變化而變化時(shí)。繪制每所房屋的地圖也可能會(huì )遇到安全和隱私問(wèn)題。

現在,麻省理工學(xué)院的工程師已經(jīng)開(kāi)發(fā)出一種導航方法,不需要提前繪制區域。取而代之的是,他們的方法使機器人能夠利用其環(huán)境中的線(xiàn)索來(lái)規劃到達目的地的路線(xiàn),這可以用一般的語(yǔ)義術(shù)語(yǔ)(例如“前門(mén)”或“車(chē)庫”)來(lái)描述,而不是作為地圖上的坐標來(lái)描述。例如,如果指示機器人將包裹運送到某人的前門(mén),則它可能會(huì )在道路上啟動(dòng)并看到一條車(chē)道,該車(chē)道已經(jīng)過(guò)訓練,可以識別出可能通往人行道,進(jìn)而又可能導致人行道到前門(mén)。

這項聰明的技術(shù)可以幫助機器人識別和區分物體

這項新技術(shù)可以大大減少機器人在確定目標之前花費在探索某處上的時(shí)間,而且它不依賴(lài)于特定住宅的地圖。

麻省理工學(xué)院機械工程系的研究生邁克爾·埃弗里特(Michael Everett)說(shuō):“我們不需要為每座需要參觀(guān)的建筑物繪制地圖。” “通過(guò)這種技術(shù),我們希望將機器人放到任何車(chē)道的盡頭,讓它找到一扇門(mén)。”

埃弗里特(Everett)將在本周的國際智能機器人與系統會(huì )議上介紹該小組的成果。該論文由麻省理工學(xué)院的航空與航天學(xué)教授喬納森·霍(Jonathan How)和福特汽車(chē)公司的賈斯汀·米勒(Justin Miller)合著(zhù),是“認知機器人最佳論文”的決賽入圍者。

“對事物的感覺(jué)”

近年來(lái),研究人員致力于將自然的語(yǔ)義語(yǔ)言引入機器人系統,訓練機器人通過(guò)其語(yǔ)義標簽識別對象,以便他們可以視覺(jué)上將門(mén)當作門(mén),例如,而不是簡(jiǎn)單地作為堅固的矩形障礙物進(jìn)行處理。 。

“現在,我們有能力使機器人實(shí)時(shí)了解事物的狀態(tài),”埃弗里特說(shuō)。

Everett,How和Miller將類(lèi)似的語(yǔ)義技術(shù)用作其新導航方法的跳板,該方法利用了現有的算法,這些算法從可視數據中提取特征,以生成同一場(chǎng)景的新地圖,以語(yǔ)義線(xiàn)索或上下文表示。

在他們的案例中,研究人員使用一種算法在機器人四處移動(dòng)時(shí)使用每個(gè)對象的語(yǔ)義標簽和深度圖像來(lái)構建環(huán)境圖。該算法稱(chēng)為語(yǔ)義SLAM(同步本地化和映射)。

盡管其他語(yǔ)義算法使機器人能夠識別并映射環(huán)境中的對象,但它們并不允許機器人在導航新環(huán)境時(shí)即以最有效的路徑到達語(yǔ)義目的地時(shí)做出決定。例如“前門(mén)”。

“在進(jìn)行探索之前,先放下一個(gè)機器人,然后說(shuō)'開(kāi)始',它會(huì )四處走動(dòng)并最終到達那里,但是速度會(huì )很慢,” How說(shuō)。

成本去

研究人員希望通過(guò)語(yǔ)義,上下文彩色的世界來(lái)加快機器人的路徑規劃。他們開(kāi)發(fā)了一種新的“待售成本估算器”,該算法將通過(guò)預先存在的SLAM算法創(chuàng )建的語(yǔ)義圖轉換為第二張圖,表示任何給定位置接近目標的可能性。

Everett說(shuō):“這是受到圖像到圖像轉換的啟發(fā),您可以在其中拍攝貓的照片并使它看起來(lái)像狗。” “在這里發(fā)生了相同類(lèi)型的想法,您拍攝一張看起來(lái)像世界地圖的圖像,然后將其轉換為另一張看起來(lái)看起來(lái)像世界地圖的圖像,但是現在根據地圖上不同點(diǎn)的接近程度對其進(jìn)行著(zhù)色達到最終目標。”

這項聰明的技術(shù)可以幫助機器人識別和區分物體

此“成本計算”地圖以彩色著(zhù)色,以將較暗的區域表示為遠離目標的位置,將較亮的區域表示為靠近目標的區域。例如,在語(yǔ)義地圖中以黃色編碼的人行道,可以通過(guò)成本核算算法轉換為新地圖中較暗的區域,而車(chē)道則在接近前門(mén)時(shí)逐漸變輕,新地圖中最亮的區域。

研究人員在來(lái)自Bing地圖的衛星圖像上訓練了這種新算法,該圖像包含來(lái)自一個(gè)城市和三個(gè)郊區的77棟房屋。該系統將語(yǔ)義圖轉換為可使用的成本圖,并按照最輕的區域映射出最有效的路徑,直至最終目標。對于每個(gè)衛星圖像,埃弗里特為典型的前院中的環(huán)境特征分配語(yǔ)義標簽和顏色,例如前門(mén)為灰色,車(chē)道為藍色,綠籬為綠色。

在此培訓過(guò)程中,團隊還對每個(gè)圖像應用了蒙版,以模仿機器人的攝像機經(jīng)過(guò)院子時(shí)可能具有的局部視圖。

“我們方法的部分技巧是[提供系統]許多局部圖像,” How解釋道。“因此,它真的必須弄清楚所有這些東西是如何相互關(guān)聯(lián)的。這就是使這項工作穩定進(jìn)行的部分原因。”

然后,研究人員在訓練數據集之外的一所全新房屋的圖像模擬中測試了他們的方法,首先使用預先存在的SLAM算法生成語(yǔ)義圖,然后使用其新的成本估算器生成第二張地圖和通往目標的路徑(在這種情況下為前門(mén))。

該小組的新的成本管理技術(shù)發(fā)現前門(mén)的速度比經(jīng)典導航算法快了189%,后者沒(méi)有考慮上下文或語(yǔ)義,而是花了過(guò)多的步驟來(lái)探索不太可能達到其目標的區域。

埃弗里特(Everett)說(shuō),結果說(shuō)明了即使在陌生,未映射的環(huán)境中,機器人也可以使用上下文有效地定位目標。

埃弗里特說(shuō):“即使機器人將包裹運送到從未去過(guò)的環(huán)境中,也可能會(huì )有與所見(jiàn)過(guò)的其他地方相同的線(xiàn)索。” “因此,世界的布局可能有所不同,但是可能存在一些共同點(diǎn)。”

這項研究得到福特汽車(chē)公司的部分支持。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。