準確檢測更改照片的人工智能變得更加智能??吹较嘈?,直到技術(shù)出現了強大的頭腦并給了我們強大而廉價(jià)的照片編輯工具?,F在,將一個(gè)人的面部表情映射到另一個(gè)人的面部表情的真實(shí)視頻(稱(chēng)為深層偽造)呈現出強大的政治武器。

但無(wú)論是縱向皺紋的良性平滑,還是操縱視頻使其看起來(lái)像政治家說(shuō)些冒犯性的東西,所有照片編輯都留下了正確工具的痕跡。
由 加州大學(xué)河濱分校的Amit Roy-Chowdhury 視頻計算小組領(lǐng)導的研究 開(kāi)發(fā)了一種深度神經(jīng)網(wǎng)絡(luò )架構,可以高精度地識別像素級別的被操縱圖像。Roy-Chowdhury是Marlan和Rosemary Bourns工程學(xué)院的電氣和計算機工程教授以及Bourns家庭教師研究員。
深度神經(jīng)網(wǎng)絡(luò )是人工智能研究人員所稱(chēng)的計算機系統,這些計算機系統經(jīng)過(guò)培訓可以完成特定的任務(wù),在這種情 這些網(wǎng)絡(luò )以連接層組織; “架構”是指層的數量和它們之間的連接結構。
圖像中的對象具有邊界,并且每當從圖像插入或移除對象時(shí),其邊界將具有與圖像中的對象的邊界自然不同的質(zhì)量。具有良好Photoshop技能的人將盡最大努力通過(guò)平滑這些邊界使插入的對象看起來(lái)盡可能自然。
雖然這可能會(huì )愚弄肉眼,但是當逐個(gè)像素地檢查時(shí),插入對象的邊界是不同的。例如,插入的邊界通常比自然對象更平滑。通過(guò)檢測插入和移除的對象的邊界,計算機應該能夠識別改變的圖像。
研究人員在大型照片數據集中標記了非操作圖像和操縱圖像邊界區域中的相關(guān)像素。目的是教授神經(jīng)網(wǎng)絡(luò )關(guān)于照片的操縱和自然區域的一般知識。他們用一組前所未見(jiàn)的圖像測試了神經(jīng)網(wǎng)絡(luò ),并且大部分時(shí)間都檢測到了改變過(guò)的圖像。它甚至發(fā)現了被操縱的區域。
“我們訓練系統區分被操縱和非操縱的圖像,現在如果你給它一個(gè)新的圖像,它能夠提供該圖像被操縱與否的概率,并定位操作發(fā)生的圖像區域, “Roy-Chowdhury說(shuō)。
目前研究人員正在研究靜止圖像,但他們指出這也可以幫助他們檢測深度視頻。
“如果你能理解靜止圖像中的特征,那么在視頻中它基本上只是將靜止圖像一個(gè)接一個(gè)地放在一起,”Roy-Chowdhury說(shuō)。“更根本的挑戰可能是弄清楚視頻中的幀是否被操縱。”
即使是單個(gè)操縱的框架也會(huì )引發(fā)紅旗。但Roy-Chowdhury認為,在自動(dòng)化工具可以檢測到野外的深度視頻之前,我們還有很長(cháng)的路要走。
“這是一個(gè)具有挑戰性的問(wèn)題,”Roy-Chowdhury說(shuō)道。“這是一種貓捉老鼠的游戲。整個(gè)網(wǎng)絡(luò )安全領(lǐng)域在某些方面試圖找到更好的防御機制,但攻擊者也找到了更好的機制。“
他說(shuō),在不久的將來(lái)可能無(wú)法實(shí)現完全自動(dòng)化的深度檢測。
“如果你想看看互聯(lián)網(wǎng)上的所有內容,一方面人類(lèi)無(wú)法做到這一點(diǎn),而自動(dòng)化系統可能無(wú)法可靠地完成任務(wù)。所以它必須是兩者的混合,“Roy-Chowdhury說(shuō)。
深度神經(jīng)網(wǎng)絡(luò )架構可以生成可疑視頻和圖像列表供人們查看。自動(dòng)化工具可以減少人們(如Facebook內容審核人員)必須篩選以確定圖像是否被操縱的數據量。
對于這種用途,工具就在附近。
“這可能是這些技術(shù)可能會(huì )在很短的時(shí)間內產(chǎn)生的,可能在幾年后,”Roy-Chowdhury說(shuō)。
該論文“ 用于圖像偽造檢測的混合LSTM和編碼器 - 解碼器架構 ”發(fā)表在IEEE圖像處理交易問(wèn)題上,由DARPA資助。其他作者包括Jawadul H. Bappy,Cody Simons,Lakshmanan Nataraj和BS Manjunath。
在相關(guān)工作中,他的小組開(kāi)發(fā)了一種除了對象插入和移除之外還用于檢測其他類(lèi)型的圖像處理的方法。該方法將模糊邊界的識別擴展為關(guān)于操縱區域和非操縱區域之間的過(guò)渡類(lèi)型的一般知識,以比當前工具更準確地預測篡改。
