根據Google的聲明,近幾年來(lái)3D傳感器(如激光雷達,深度感應攝像頭和雷達)的增長(cháng),導致需要一種可以處理這些設備捕獲的數據的場(chǎng)景理解技術(shù)。Google認為,這種需求技術(shù)可以使使用這些傳感器的機器學(xué)習系統(例如自動(dòng)駕駛汽車(chē)和機器人)在現實(shí)世界中導航和操作,從而在移動(dòng)設備上創(chuàng )造增強的增強現實(shí)體驗。

搜索引擎提供商Google指出,計算機視覺(jué)領(lǐng)域最近在理解3D風(fēng)景方面取得了良好的進(jìn)展,其中包括用于移動(dòng)3D對象檢測,透明對象檢測的模型等等。但是,該公司在其博客文章中指出,由于可用性工具和資源有限,可能難以在現場(chǎng)進(jìn)行操作。
科技巨頭Google已發(fā)布TensorFlow 3D,這是一個(gè)模塊化且高效的庫,旨在為T(mén)ensorFlow帶來(lái)三維深度學(xué)習功能,以進(jìn)一步發(fā)展和改善對三維場(chǎng)景的理解,并減少感興趣的研究人員的進(jìn)入障礙。
由技術(shù)公司開(kāi)發(fā)的TensorFlow 3D庫允許更廣泛的研究社區開(kāi)發(fā),訓練和分發(fā)前沿的3D場(chǎng)景理解模型。此外,新庫提供了流行的交易,損失功能,數據處理工具,模型和指標。
TF 3D還可以啟用其他潛在應用程序,例如3D對象形狀預測,點(diǎn)云記錄和點(diǎn)云凝結。此外,它提供了統一的數據集功能和配置,用于訓練和評估標準3D場(chǎng)景洞察數據集。
由Google在博客文章中宣布的新庫目前支持Waymo Open,ScanNet和Rio數據集。但是,用戶(hù)可以將其他流行的數據集(例如NuScenes和Kitti)自由轉換為相似的格式,并在預先存在的或定制的管道中使用它們。
Google還指出,用戶(hù)可以利用TF 3D進(jìn)行各種3D深度學(xué)習研究和應用,通過(guò)快速構建原型并嘗試新想法來(lái)實(shí)施實(shí)時(shí)推理系統。
要了解有關(guān)由Google創(chuàng )建的TensorFlow 3D的更多信息,以進(jìn)一步發(fā)展和改善對三維場(chǎng)景的理解,您可以訪(fǎng)問(wèn)Google發(fā)布的有關(guān)該主題的博客文章。
