Waymo利用DeepMind的進(jìn)化AI技術(shù)來(lái)訓練自動(dòng)駕駛汽車(chē)算法

2020-03-28 20:16:48    來(lái)源:新經(jīng)網(wǎng)    作者:安曉星

Alphabet公司的人工智能研究部門(mén)DeepMind正在協(xié)助其姊妹公司W(wǎng)aymo在自動(dòng)駕駛汽車(chē)市場(chǎng)做出努力。

DeepMind的研究人員今天在該小組博客中的帖子中詳細介紹了合作。該部門(mén)一直在與Waymo合作,利用一種稱(chēng)為“基于人口的培訓”的技術(shù)來(lái)加速自動(dòng)駕駛軟件的開(kāi)發(fā)。

Waymo利用DeepMind的進(jìn)化AI技術(shù)來(lái)訓練自動(dòng)駕駛汽車(chē)算法

該方法最初由DeepMind發(fā)明,是先前的AI項目的一部分,該方法借鑒了進(jìn)化的線(xiàn)索來(lái)增強AI模型。 在某些方面,構建神經(jīng)網(wǎng)絡(luò )的過(guò)程本質(zhì)上是進(jìn)化的。在開(kāi)發(fā)過(guò)程中,AI模型會(huì )經(jīng)過(guò)培訓課程,在其中訓練樣本數據并修改其行為以產(chǎn)生更準確的結果。

但是,許多其他基本的開(kāi)發(fā)任務(wù)仍然必須使用手動(dòng)方法執行。 在這些任務(wù)中最重要的一項是超參數探索,這是DeepMind幫助Waymo簡(jiǎn)化的一項任務(wù)。這是對硬編碼到AI模型中的基本行為設置進(jìn)行微調的過(guò)程。工程師通常手動(dòng)設置模型的設置,或者在復雜的項目中使用計算機輔助的搜索,其中腳本嘗試大量隨機生成的選項。

基于人群的培訓使工作流程更加高效?;靖拍钍鞘褂米詣?dòng)化算法來(lái)測試一組AI模型中的不同設置組合,識別表現欠佳的成員并將其替換為表現最佳的對等版本。該小組在每個(gè)這樣的周期處理數據方面都變得更好。

Waymo利用DeepMind的進(jìn)化AI技術(shù)來(lái)訓練自動(dòng)駕駛汽車(chē)算法

DeepMind的研究人員詳細介紹說(shuō):“網(wǎng)絡(luò )會(huì )定期進(jìn)行評估,并以進(jìn)化的方式相互競爭以求生存。” “如果某個(gè)群體的成員表現不佳,就會(huì )被表現更好的成員的“后代”所取代。后代是性能更好的成員的副本,具有超突變的超參數。”

DeepMind與Waymo合作,將這種方法應用于優(yōu)化集團的自動(dòng)駕駛模型。在他們的第一個(gè)聯(lián)合項目中,Waymo使用了該技術(shù)來(lái)訓練AI,以檢測自動(dòng)駕駛汽車(chē)附近的行人,汽車(chē)和其他物體?;谌丝诘呐嘤栍兄趯⒛P彤a(chǎn)生的誤報數量減少24%。

Waymo利用DeepMind的進(jìn)化AI技術(shù)來(lái)訓練自動(dòng)駕駛汽車(chē)算法

Waymo繼續將該技術(shù)應用于其他項目。使用該方法,該小組將為AI找到最佳設置集所需的時(shí)間和為此所需的處理能力減少了一半。另外,它減少了開(kāi)發(fā)過(guò)程中的手動(dòng)輸入,從而為研究人員節省了時(shí)間。

研究人員寫(xiě)道:“通過(guò)將PBT(基于人口的培訓)直接整合到Waymo的技術(shù)基礎架構中,公司各處的研究人員都可以通過(guò)單擊按鈕來(lái)應用此方法,而花費更少的時(shí)間來(lái)調整他們的學(xué)習率。” “自完成這些實(shí)驗以來(lái),PBT已應用于許多不同的Waymo模型,并有望在幫助路上制造出更有能力的車(chē)輛方面大有希望。”

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。