向駕駛員顯示有關(guān)其路線(xiàn)的更多詳細信息通??梢詭椭麄冊谀吧奈恢脤Ш?。例如,車(chē)道計數可以使GPS系統警告駕駛員偏離或合并車(chē)道。合并有關(guān)停車(chē)位的信息可以幫助駕駛員提前計劃,而繪制自行車(chē)道則可以幫助騎自行車(chē)的人談判繁忙的城市街道。提供有關(guān)道路狀況的最新信息也可以改善救災計劃。

但是創(chuàng )建詳細的地圖是一個(gè)昂貴且耗時(shí)的過(guò)程,大部分由大公司(例如Google)完成,該過(guò)程會(huì )用綁在引擎蓋上的攝像頭向車(chē)輛發(fā)送來(lái)捕獲該區域道路的視頻和圖像。將其與其他數據結合可以創(chuàng )建準確的最新地圖。但是,由于此過(guò)程很昂貴,因此世界上的某些地區被忽略了。

一種解決方案是在衛星圖像上釋放機器學(xué)習模型(更易于定期獲取和更新),以自動(dòng)標記道路特征。但是道路可能會(huì )被樹(shù)木和建筑物遮擋,這是一項艱巨的任務(wù)。麻省理工學(xué)院和QCRI研究人員在人工智能促進(jìn)協(xié)會(huì )會(huì )議上發(fā)表的一篇論文中描述了“ RoadTagger”,它使用神經(jīng)網(wǎng)絡(luò )架構的組合來(lái)自動(dòng)預測后面的車(chē)道和道路類(lèi)型(住宅或高速公路)的數量障礙物。
在對美國20個(gè)城市的數字地圖上被遮擋的道路上測試RoadTagger時(shí),該模型對車(chē)道號的準確度為77%,對推斷的道路類(lèi)型的準確度為93%。研究人員還計劃使RoadTagger能夠預測其他特征,例如停車(chē)位和自行車(chē)道。
“最新的數字地圖來(lái)自大公司最關(guān)心的地方。如果您在他們不太在意的地方,則在地圖質(zhì)量方面處于劣勢。”合著(zhù)者,電機工程和計算機科學(xué)系(EECS)的教授Sam Madden說(shuō)。以及計算機科學(xué)與人工智能實(shí)驗室(CSAIL)的研究員。“我們的目標是使生成高質(zhì)量數字地圖的過(guò)程自動(dòng)化,以便可以在任何國家/地區使用。”
該論文的共同作者是CSAIL研究生何松濤,Favyan Bastani和Edward Park。EECS本科生Satvat Jagwani;CSAIL教授Mohammad Alizadeh和Hari Balakrishnan教授;QCRI研究人員Sanjay Chawla,Sofiane Abbar和Mohammad Amin Sadeghi。
結合CNN和GNN
Madden說(shuō),QCRI所基于的Quatar“對于構建數字地圖的大公司而言不是優(yōu)先事項”。然而,它正在不斷地建設新的道路,并改善舊的道路,尤其是為主辦2022年FIFA世界杯做準備。
麥登說(shuō):“在訪(fǎng)問(wèn)卡塔爾時(shí),我們經(jīng)歷了Uber司機無(wú)法弄清楚自己要去哪里的經(jīng)歷,因為地圖太近了,” “如果導航應用程序沒(méi)有正確的信息,那么對于諸如車(chē)道合并之類(lèi)的事情,這可能會(huì )令人沮喪甚至更糟。”
RoadTagger依賴(lài)于通常用于圖像處理任務(wù)的卷積神經(jīng)網(wǎng)絡(luò )(CNN)和圖神經(jīng)網(wǎng)絡(luò )(GNN)的新穎組合。GNN在圖中連接的節點(diǎn)之間建立模型關(guān)系,并已廣泛用于分析諸如社交網(wǎng)絡(luò )和分子動(dòng)力學(xué)之類(lèi)的事物。該模型是“端到端”的,這意味著(zhù)它僅饋送原始數據并自動(dòng)產(chǎn)生輸出,而無(wú)需人工干預。
CNN將目標道路的原始衛星圖像作為輸入。GNN將道路分為大約20米的路段(或“平鋪”)。每個(gè)圖塊都是一個(gè)單獨的圖形節點(diǎn),通過(guò)沿道路的線(xiàn)連接。對于每個(gè)節點(diǎn),CNN都會(huì )提取道路特征,并與其直接鄰居共享該信息。道路信息會(huì )沿著(zhù)整個(gè)圖形傳播,每個(gè)節點(diǎn)都會(huì )收到其他每個(gè)節點(diǎn)有關(guān)道路屬性的信息。如果圖像中遮擋了某個(gè)圖塊,RoadTagger將使用道路上所有圖塊的信息來(lái)預測遮擋的背后。
研究人員說(shuō),這種組合架構代表了更像人類(lèi)的直覺(jué)。假設四車(chē)道的道路的一部分被樹(shù)木遮擋,因此某些圖塊僅顯示兩條車(chē)道。人們可以輕易地推測出樹(shù)木背后隱藏著(zhù)兩條車(chē)道。傳統的機器學(xué)習模型(例如CNN)僅提取單個(gè)圖塊的特征,最有可能預測被遮擋的圖塊是一條兩條車(chē)道。
他說(shuō):“人類(lèi)可以使用相鄰圖塊中的信息來(lái)猜測被遮擋的圖塊中的車(chē)道數量,但是網(wǎng)絡(luò )無(wú)法做到這一點(diǎn)。” “我們的方法試圖模仿人類(lèi)的自然行為,我們從CNN捕獲本地信息,從GNN捕獲全球信息,以做出更好的預測。”
學(xué)習權重
為了訓練和測試RoadTagger,研究人員使用了稱(chēng)為OpenStreetMap的真實(shí)世界地圖數據集,該數據集使用戶(hù)可以編輯和管理全球數字地圖。他們從該數據集中,從包括波士頓,芝加哥,華盛頓和西雅圖在內的20個(gè)美國城市的688平方公里地圖上收集了已確認的道路屬性。然后,他們從Google Maps數據集中收集了相應的衛星圖像。
在培訓中,RoadTagger學(xué)習了CNN和GNN的權重-這些權重為特征和節點(diǎn)連接分配了不同的重要性。CNN從圖塊的像素圖案中提取特征,而GNN沿圖傳播學(xué)習的特征。從道路的隨機選擇子圖中,系統學(xué)習預測每個(gè)圖塊的道路特征。這樣,它會(huì )自動(dòng)了解哪些圖像特征有用,以及如何沿圖傳播這些特征。例如,如果目標圖塊具有不清晰的車(chē)道標記,但是其相鄰圖塊具有四個(gè)具有清晰車(chē)道標記的車(chē)道,并且共享相同的道路寬度,則目標圖塊很可能也具有四個(gè)車(chē)道。在這種情況下,模型會(huì )自動(dòng)獲悉道路寬度是有用的圖像特征,因此,如果兩個(gè)相鄰的圖塊共享相同的道路寬度,
給定OpenStreetMap訓練中未見(jiàn)的道路,該模型將道路分解為小塊,并使用其學(xué)習的權重進(jìn)行預測。該模型的任務(wù)是預測被遮擋的圖塊中的車(chē)道數量,該模型指出相鄰圖塊具有匹配的像素模式,因此共享信息的可能性很高。因此,如果這些圖塊具有四個(gè)車(chē)道,則被遮擋的圖塊也必須具有四個(gè)車(chē)道。

在另一個(gè)結果中,RoadTagger在合成的,極具挑戰性的道路中斷數據集中準確預測了車(chē)道號。作為一個(gè)示例,具有兩個(gè)車(chē)道的立交橋覆蓋了具有四個(gè)車(chē)道的目標道路的幾塊瓷磚。該模型檢測到立交橋的像素模式不匹配,因此它忽略了覆蓋圖塊上的兩條車(chē)道,準確地預測了下面的四個(gè)車(chē)道。
研究人員希望使用RoadTagger來(lái)幫助人們快速驗證并批準對數據集(如OpenStreetMap)中基礎結構的持續修改,其中許多地圖都不包含車(chē)道數或其他詳細信息。Bastani說(shuō),一個(gè)特別感興趣的地區是泰國,那里的道路在不斷變化,但是數據集中幾乎沒(méi)有更新。
“曾經(jīng)被標記為土路的道路已經(jīng)鋪好,所以最好繼續行駛,并且一些交叉路口已經(jīng)完全建成。每年都有變化,但是數字地圖已經(jīng)過(guò)時(shí)了。”他說(shuō)。“我們希望根據最新圖像不斷更新此類(lèi)道路屬性。”
