vidia Research今天推出了GauGAN,這是一種生成性的對抗性AI系統,可以讓您創(chuàng )建從未存在過(guò)的逼真的風(fēng)景圖像。今天在加利福尼亞州圣何塞舉行的GPU技術(shù)大會(huì )(GTC)上展示了新系統的研究和演示。

應用深度學(xué)習研究Bryan Catanzaro的Nvidia副總裁說(shuō),GauGAN建立在去年推出的能夠呈現虛擬世界的Pix2Pix系統的基礎上,但是Pix2Pix無(wú)法描繪風(fēng)景,因為這樣做會(huì )在最終圖像中留下瑕疵。
GauGAN的神經(jīng)網(wǎng)絡(luò )通過(guò)一百萬(wàn)個(gè)開(kāi)源Flickr圖像進(jìn)行訓練,并且充滿(mǎn)了對超過(guò)180個(gè)物體(如雪,樹(shù)木,水,花,灌木,丘陵或山脈)之間關(guān)系的理解。
對物體如何相互關(guān)聯(lián)的理解意味著(zhù)水旁的樹(shù)將顯示反射,或者當季節變化并且地面上有雪時(shí),樹(shù)木將被描繪成沒(méi)有葉子。
風(fēng)格轉移也是可能的,因此圖像可以采用溫暖的夕陽(yáng)光或顯示城市天際線(xiàn)的冷光。
GauGAN應用程序使用分割圖,它有點(diǎn)像著(zhù)色書(shū),描述對象的位置但不提供細節,如下所示。

Nvidia主要研究科學(xué)家Ming-Yu Liu和其他人詳細介紹了GauGAN的創(chuàng )建及其用于照片處理的空間自適應非規范化方法的論文今天發(fā)布。該論文還于6月在加利福尼亞州長(cháng)灘舉行的計算機視覺(jué)和模式識別(CVPR)2019年會(huì )議上接受口頭報告。
今天首次亮相的還有Nvidia AI Playground,這是一個(gè)網(wǎng)站,人們可以修補各種訓練有素的神經(jīng)網(wǎng)絡(luò ),如GauGAN,使用強大的AI來(lái)扭曲視覺(jué)效果或創(chuàng )造逼真的圖像。
GauGAN是來(lái)自Nvidia的最新逼真的人工智能系統,它是像StyleGAN這樣的深度技術(shù)的創(chuàng )造者,可以生成從未存在的人的逼真圖像,而Nvidia上個(gè)月開(kāi)源。
在回答Nvidia釋放另一個(gè)可以讓人質(zhì)疑真實(shí)情況的系統的問(wèn)題時(shí),Catanzaro說(shuō)作為一名研究人員,“這是我的夢(mèng)想”,因為實(shí)現這些結果所必需的技術(shù)代表了進(jìn)步 - 但另一方面,它是有些人可能濫用的技術(shù)。
“就個(gè)人而言,我認為這是一個(gè)信任問(wèn)題,而不是技術(shù)問(wèn)題,”卡坦扎羅說(shuō)。
Catanzaro表示,他最為興奮的是,GauGAN被視頻游戲設計師采用,創(chuàng )造了虛擬世界的景觀(guān),并設想將這項技術(shù)應用于使用故事板來(lái)展示他們創(chuàng )作的創(chuàng )意人。
