<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<table id="ushxw"><strike id="ushxw"></strike></table>

<ruby id="ushxw"><menuitem id="ushxw"><delect id="ushxw"></delect></menuitem></ruby>

<blockquote id="ushxw"></blockquote>

AI傾聽(tīng)了人們的聲音然后產(chǎn)生了他們的臉

2020-04-09 11:55:54 來(lái)源：新經(jīng)網(wǎng) 作者：馮思韻

您是否曾經(jīng)僅僅根據他們的聲音來(lái)構造一個(gè)從未見(jiàn)過(guò)的人的心理形象?人工智能(AI)現在可以做到這一點(diǎn)，僅使用簡(jiǎn)短的音頻剪輯作為參考即可生成人臉的數字圖像。

AI傾聽(tīng)了人們的聲音然后產(chǎn)生了他們的臉

這個(gè)名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò )(一種以類(lèi)似于人腦的方式“思考”的計算機)經(jīng)過(guò)科學(xué)家培訓，接受了來(lái)自互聯(lián)網(wǎng)的數百萬(wàn)個(gè)教育視頻，顯示了100,000多個(gè)不同的人在說(shuō)話(huà)。

研究人員在一項新研究中寫(xiě)道，Speech2Face通過(guò)該數據集學(xué)習了語(yǔ)音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后，AI使用音頻剪輯對與語(yǔ)音匹配的真實(shí)感面部建模。

值得慶幸的是，人工智能還不能僅僅根據他們的聲音確切地知道特定的人是什么樣。研究作者報告說(shuō)，神經(jīng)網(wǎng)絡(luò )識別語(yǔ)音中的某些標記，這些標記指向性別，年齡和種族，是許多人共有的特征。

AI傾聽(tīng)了人們的聲音然后產(chǎn)生了他們的臉

科學(xué)家寫(xiě)道：“因此，該模型只會(huì )產(chǎn)生看上去普通的面孔。” “它不會(huì )產(chǎn)生特定個(gè)人的圖像。”

盡管坦率地說(shuō)，對貓的解釋有點(diǎn)讓人恐懼，但AI已經(jīng)證明它可以產(chǎn)生出異常準確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是，根據這項研究，這些圖像通常確實(shí)可以捕捉到正確的年齡范圍，種族和性別。

但是，該算法的解釋遠非完美。當面對語(yǔ)言變化時(shí)，Speech2Face表現出“混合表現”。例如，當AI收聽(tīng)亞洲人講中文的音頻片段時(shí)，該程序會(huì )產(chǎn)生亞洲人臉的圖像。然而，據科學(xué)家報道，當同一個(gè)人用不同的音頻片段講英語(yǔ)時(shí)，人工智能產(chǎn)生了白人的面孔。

AI傾聽(tīng)了人們的聲音然后產(chǎn)生了他們的臉

該算法還顯示出性別偏見(jiàn)，將低音調的聲音與男性面孔相關(guān)聯(lián)，將高音調的聲音與女性面孔相關(guān)聯(lián)。研究人員寫(xiě)道，由于訓練數據集僅代表YouTube上的教育視頻，因此“并不代表整個(gè)世界人口。”

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時(shí)間聯(lián)系我們修改或刪除，多謝。

RM新时代投资官网

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<option id="91jhy"><small id="91jhy"><output id="91jhy"></output></small></option>