新的深度學(xué)習研究打破了自動(dòng)駕駛汽車(chē)圖像識別能力的記錄

2020-05-17 14:10:39    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻

人,自行車(chē),汽車(chē)或道路,天空,草地:圖像的哪些像素代表無(wú)人駕駛汽車(chē)前的不同前景人物或物體,哪些像素代表背景類(lèi)別?這項稱(chēng)為全景分割的任務(wù)是一個(gè)基本問(wèn)題,已在許多領(lǐng)域中應用,例如自動(dòng)駕駛汽車(chē),機器人技術(shù),增強現實(shí),甚至在生物醫學(xué)圖像分析中。在弗萊堡大學(xué)計算機科學(xué)系,Abhinav Valada博士是機器人學(xué)習的助理教授,也是BrainLinks-BrainTools的成員,他專(zhuān)注于這個(gè)研究問(wèn)題。Valada和他的團隊開(kāi)發(fā)了最先進(jìn)的“ EfficientPS”人工智能(AI)模型,該模型可以更快,更有效地對視覺(jué)場(chǎng)景進(jìn)行連貫識別。

新的深度學(xué)習研究打破了自動(dòng)駕駛汽車(chē)圖像識別能力的記錄

這項任務(wù)通常使用稱(chēng)為深度學(xué)習的機器學(xué)習技術(shù)來(lái)解決,其中人工神經(jīng)網(wǎng)絡(luò )弗賴(lài)堡研究人員解釋說(shuō),它們是從人腦中汲取靈感,從大量數據中學(xué)習。諸如Cityscapes之類(lèi)的公共基準在衡量這些技術(shù)的進(jìn)步方面起著(zhù)重要作用。Valada團隊的成員Rohit Mohan說(shuō):“多年來(lái),來(lái)自Google或Uber的研究團隊一直在這些基準測試中爭奪榜首。” 來(lái)自弗萊堡(Freiburg)的計算機科學(xué)家的方法已被開(kāi)發(fā)出來(lái),用于理解城市的城市場(chǎng)景,在“城市景觀(guān)”(Cityscapes)中排名第一,Cityscapes是最有影響力的自動(dòng)駕駛場(chǎng)景理解研究的排行榜。EfficientPS還始終在其他標準基準數據集(例如KITTI,Mapillary Vistas和IDD)上設置新的最新技術(shù)。

在項目網(wǎng)站上,Valada展示了團隊如何在各種數據集上訓練不同AI模型的示例。結果疊加在相應的輸入圖像上,其中顏色顯示模型將像素分配給的對象類(lèi)別。例如,汽車(chē)標記為藍色,人物標記為紅色,樹(shù)木標記為綠色,建筑物標記為灰色。此外,AI模型還在每個(gè)被視為獨立實(shí)體的對象周?chē)L制邊框。弗萊堡大學(xué)的研究人員成功地訓練了該模型,以將所學(xué)的城市場(chǎng)景信息從斯圖加特轉移到紐約市。盡管AI模型不知道美國的城市長(cháng)什么樣,但它能夠準確識別紐約市的場(chǎng)景。

Valada解釋說(shuō),以前解決該問(wèn)題的大多數方法都具有較大的模型尺寸,并且在實(shí)際應用中(例如受資源嚴重限制的機器人技術(shù))在計算上非常昂貴,“我們的EfficientPS不僅可以實(shí)現最新的性能,而且這也是計算效率最高,最快的方法。這進(jìn)一步擴展了可以使用EfficientPS的應用程序。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。