新的Resemble AI軟件將3分鐘的記錄轉換為合成語(yǔ)音配置文件

2020-02-09 14:43:32    來(lái)源:    作者:

合成語(yǔ)音技術(shù)初創(chuàng )公司Resemble AI首次推出了一種新工具,用于根據一些稱(chēng)為Resemble Clone的簡(jiǎn)短錄音創(chuàng )建數字語(yǔ)音。使用“類(lèi)似克隆”,可以使用某人的幾分鐘的聲音來(lái)制作自定義語(yǔ)音,聽(tīng)起來(lái)像錄音中的人或虛擬的變體。

新的Resemble AI軟件將3分鐘的記錄轉換為合成語(yǔ)音配置文件

語(yǔ)音克隆

酷似AI開(kāi)發(fā)語(yǔ)音軟件來(lái)復制或合成語(yǔ)音以用于許多潛在目的??崴瓶寺?Resemble Clone)專(zhuān)門(mén)針對娛樂(lè )業(yè),該公司認為這可能是其技術(shù)的主要受益者。該軟件工具僅需要有人發(fā)出聲音至少三分鐘即可開(kāi)始創(chuàng )建人工配置文件。根據創(chuàng )始人在今年早些時(shí)候的采訪(fǎng)中對Voicebot所說(shuō),錄音時(shí)間越長(cháng),聽(tīng)起來(lái)越自然。語(yǔ)音甚至不必現場(chǎng)直播,可以使用任何錄音。

“這是[所有]聲音表演范式的轉變。就像視覺(jué)技術(shù)的進(jìn)步,演員的工作量減少了。” Resemble AI聯(lián)合創(chuàng )始人Zohaib Ahmed在接受采訪(fǎng)時(shí)告訴Voicebot。“對這種技術(shù)以及對[合成]語(yǔ)音技術(shù)的需求只會(huì )越來(lái)越大。”

新的Resemble AI軟件將3分鐘的記錄轉換為合成語(yǔ)音配置文件

最終結果聽(tīng)起來(lái)確實(shí)像人,但仍可以與真實(shí)聲音區分開(kāi)。很難辨別出非常高端的假貨。這就是為什么這家位于多倫多和舊金山的初創(chuàng )公司還為Resemblyzer提供開(kāi)放源代碼工具的原因,該工具可用于從真實(shí)音頻中挑選出深造的東西。

真實(shí)市場(chǎng)的綜合演講

Resemble AI是一家年輕的初創(chuàng )公司,是今年紐約Betaworks Ventures Synthetic Camp加速器計劃的一部分,該計劃獲得了20萬(wàn)美元的投資。然而,看到聲音聽(tīng)起來(lái)像人為的人工產(chǎn)生語(yǔ)音的方式并不是唯一的。其他初創(chuàng )公司以及科技巨頭都在追求類(lèi)似的想法。

在啟動(dòng)方面,澳大利亞出生的語(yǔ)音合成啟動(dòng)副本影城最近關(guān)閉的一個(gè)$ 2.5萬(wàn)種子資金,由該企業(yè)現實(shí)基金圓形LED。同時(shí),最初是語(yǔ)音假體開(kāi)發(fā)人員的VocaliD現在為全球的呼叫中心和語(yǔ)音應用程序提供合成語(yǔ)音。

新的Resemble AI軟件將3分鐘的記錄轉換為合成語(yǔ)音配置文件

知名人士也沒(méi)有忽略這個(gè)空間。亞馬遜和谷歌都在致力于人工語(yǔ)音生成的變體。Google助理正在試驗WaveNet技術(shù),而Alexa使用神經(jīng)文本語(yǔ)音轉換(NTTS)是亞馬遜使Alexa模仿塞繆爾·杰克遜(Samuel L. Jackson)聲音的方式。中國百度公司也在發(fā)展自己的聲音克隆。類(lèi)似于A(yíng)I的公司和其他初創(chuàng )公司將需要提供獨特的功能,以與大型公司的產(chǎn)品脫穎而出。類(lèi)似于克隆之類(lèi)的工具至少可以幫助人們更加了解市場(chǎng)的發(fā)展趨勢。人們將需要盡可能多的靈活性和自定義選項,Resemble AI將成為人們在制作下一個(gè)電影,視頻游戲或語(yǔ)音應用程序時(shí)想到的名字。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。