<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<rp id="kh92r"><pre id="kh92r"></pre></rp>

<sup id="kh92r"></sup>

Nvidia制定了快速流程以從2D圖像生成3D模型

2020-01-29 11:10:23 來(lái)源：作者：

技術(shù)觀(guān)察家中，Hot Hardware的 Paul Lilly 表示，他們從2-D到3-D的方式是新聞。當路徑是反向的3D轉換為2D時(shí)，這也就不足為奇了，但是“在不提供系統3D數據的情況下創(chuàng )建3D 模型則更具挑戰性。”

Nvidia制定了快速流程以從2D圖像生成3D模型

禮來(lái)(Lilly)引用了致力于渲染方法的研究團隊之一高俊(Jun Gao)的話(huà)。“這實(shí)際上是有史以來(lái)第一次，您幾乎可以拍攝任何2D圖像并預測相關(guān)的3D屬性。”

他們從2-D圖像生成3-D對象的魔力在于“可差分基于插值的渲染器”或DIB-R。Nvidia的研究人員在包含鳥(niǎo)類(lèi)圖像的數據集上訓練了他們的模型。經(jīng)過(guò)訓練，DIB-R能夠拍攝鳥(niǎo)類(lèi)圖像并傳遞3D圖像，并具有3D鳥(niǎo)類(lèi)正確的形狀和紋理。

Nvidia進(jìn)一步描述了將輸入轉換為用于預測特定信息(例如圖像的形狀，顏色，紋理和光照)的特征圖或向量的方法。

為何重要：Gizmodo的標題進(jìn)行了總結。“ Nvidia教了AI從平面2-D圖像即時(shí)生成全紋理的3-D模型。” “立即”這個(gè)詞很重要。

Nvidia制定了快速流程以從2D圖像生成3D模型

Nvidia的Lauren Finkle 說(shuō)，DIB-R可以在不到100毫秒的時(shí)間內從2D圖像生成3D對象。“它是通過(guò)改變代表3D形狀的傳統模板多邊形球來(lái)實(shí)現的。DIB-R對其進(jìn)行更改以匹配2D圖像中描繪的真實(shí)物體形狀。”

Gizmodo的 Andrew Liszewski 強調了這100毫秒的時(shí)間要素。“令人印象深刻的處理速度使該工具特別有趣，因為它具有極大地改善機器人或自動(dòng)駕駛汽車(chē)之類(lèi)的機器如何看待世界并了解其前身的潛力的潛力。”

關(guān)于自動(dòng)駕駛汽車(chē)，利澤夫斯基說(shuō)：“從攝像機實(shí)時(shí)視頻流中提取的靜止圖像可以立即轉換為3D模型，從而使自動(dòng)駕駛汽車(chē)能夠準確地確定需要避免的大型卡車(chē)的尺寸。 ”

可以從2D圖像推斷出3D對象的模型將能夠執行更好的對象跟蹤，Lilly轉向考慮將其用于機器人技術(shù)。他說(shuō)：“通過(guò)將2D圖像處理成3D模型，自主機器人將處于更好的位置，可以更安全，更有效地與其環(huán)境進(jìn)行交互。”

Nvidia指出，要做到這一點(diǎn)，自主機器人“必須能夠感知和理解其周?chē)h(huán)境。DIB-R可能會(huì )改善這些深度感知能力。”

Nvidia制定了快速流程以從2D圖像生成3D模型

同時(shí)，Gizmodo的Liszewski提到了Nvidia方法可以為安全做些什么。“ DIB-R甚至可以提高用于識別人員并跟蹤人員的安全攝像機的性能，因為即時(shí)生成的3D模型將使人們在視野范圍內移動(dòng)時(shí)更容易進(jìn)行圖像匹配。”

Nvidia研究人員將于本月在溫哥華舉行的年度神經(jīng)信息處理系統會(huì )議(NeurIPS)上介紹他們的模型。

那些想了解更多關(guān)于他們的研究的人可以在arXiv上查閱他們的論文，“學(xué)會(huì )使用基于插值的微分渲染器預測3D對象”。作者是陳文正，高俊，Hua玲，愛(ài)德華·史密斯，Jaakko Lehtinen，Alec Jacobson和Sanja Fidler。

他們提出了“一個(gè)完整的基于光柵化的微分渲染器，可以通過(guò)解析來(lái)計算梯度。” 他們說(shuō)，當包裹在神經(jīng)網(wǎng)絡(luò )周?chē)鷷r(shí)，他們的框架學(xué)會(huì )了從單個(gè)圖像預測形狀，紋理和光線(xiàn)，并且展示了他們的框架“以學(xué)習3D紋理形狀的生成器”。

作者在摘要中指出：“許多機器學(xué)習模型都對圖像進(jìn)行操作，但是忽略了這樣的事實(shí)，即圖像是由3-D幾何體與光相互作用形成的2-D投影，這一過(guò)程稱(chēng)為渲染。使ML模型能夠理解圖像形成可能是推廣的關(guān)鍵。”

他們提出了DIB-R作為框架，該框架可以分析圖像中所有像素的梯度。

他們說(shuō)，他們方法的關(guān)鍵是“將前景柵格化視為局部屬性的加權插值，將背景柵格化視為基于距離的全局幾何聚合。我們的方法允許對頂點(diǎn)位置，顏色，法線(xiàn)和光照方向進(jìn)行精確優(yōu)化并通過(guò)各種照明模型協(xié)調紋理。”

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時(shí)間聯(lián)系我們修改或刪除，多謝。

RM新时代投资官网

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<p id="agvr6"></p>

<abbr id="agvr6"></abbr>