AI合成技術(shù)正在通過(guò)各種智能設備實(shí)現并應用

2019-09-20 16:49:30    來(lái)源:人工智能網(wǎng)    作者:

近日,百度地圖推出了定制化語(yǔ)音導航功能,簡(jiǎn)單說(shuō)就是用戶(hù)根據提示采集原聲,十幾分鐘后你將獲得屬于自己定制化的語(yǔ)音導航音頻包。所以說(shuō)用戶(hù)除了郭德綱、林志玲、羅振宇……這一票人之外還有更多選擇。其實(shí)我們在使用明星導航音頻包時(shí)會(huì )發(fā)現,除了很多“左轉”“紅綠燈路口”這類(lèi)常規交通詞匯外,很多涉及地名的、地標的詞是可以聽(tīng)的出是合成的。而現在“語(yǔ)音合成”技術(shù)推向普通用戶(hù),就有了這些AI定制化合成服務(wù)。

單從使用AI合成的相關(guān)App來(lái)看,不禁聯(lián)想到那個(gè)“一夜而紅”的ZAO,還有國外的Deepfake,AI脫衣軟件DeepNude等等。而國內專(zhuān)注于人工智能領(lǐng)域的企業(yè)越來(lái)越多,例如:商湯科技、曠視科技這兩艘“AI巨輪”的業(yè)務(wù)主要是對政府及企業(yè)的;而科大訊飛、大疆、華為、小米、優(yōu)必選科技的部分硬件類(lèi)業(yè)務(wù)是to C類(lèi)的;極鏈科技是專(zhuān)注于視頻領(lǐng)域的人工智能企業(yè),業(yè)務(wù)面向品牌主及流量方,也就是to B類(lèi)的。

對于廣大 C端 用戶(hù)來(lái)說(shuō),AI合成技術(shù)正在通過(guò)各種智能設備實(shí)現并應用。比如地圖AR增強,定制化音頻服務(wù)、定制化視頻服務(wù)、專(zhuān)屬智能客服等。

其實(shí)剛才提到過(guò)的曾經(jīng)爆火的這些App應用,“ZAO”、“Deepfake”、“DeepNude”技術(shù)上有些共同之處,但是娛樂(lè )的點(diǎn)不同。“DeepNude”涉及色情內容,并上升到人身攻擊最終被禁止。網(wǎng)友用“Deepfake”在網(wǎng)上大量惡搞政府首腦,比如特朗普的惡搞視頻眾多。

而離我們最近的“ZAO”,在有了前車(chē)之鑒后,看的出在盡可能規避可能產(chǎn)生的負面效果,視頻素材內容由平臺方把控。但不可避免的是在用戶(hù)對照片進(jìn)行授權所涉及的隱私問(wèn)題,因為不單純是上傳照片即可,而是需要用戶(hù)多角度的認證,有些“恐慌”確實(shí)不可避免,因為掃臉支付、掃臉登陸等功能已經(jīng)被廣泛應用,這是用戶(hù)最直接的對“ZAO”開(kāi)發(fā)者的質(zhì)疑。隨后不久背后的公司陌陌科技被有關(guān)部門(mén)談話(huà)并要求整改,目前來(lái)看在ios的熱度及下載量仍然穩定在前三名。

不再處于風(fēng)口浪尖,“ZAO”進(jìn)入了平穩期,而大家對其盈利模式以及產(chǎn)品定位仍有疑問(wèn),似乎并沒(méi)看到一個(gè)清晰的變現方式。雖說(shuō)當前“視頻社交”火爆,但是僅憑陌陌的用戶(hù)帶動(dòng)還是比較乏力的。App自身沒(méi)有社交屬性,只是單純的內容產(chǎn)出,和其他的分發(fā)渠道聯(lián)合顯得很必要。而問(wèn)題又來(lái)了,這些內容只適合小范圍內私域傳播,用戶(hù)不愿意擴散是關(guān)鍵。沒(méi)有爆炸傳播的潛質(zhì),所以營(yíng)銷(xiāo)能力也被削弱?;蛟S只是曇花一現,但是對于用戶(hù)來(lái)說(shuō),拍照合成視頻的趣味性還是非常強的,但關(guān)于變現場(chǎng)景仍需要一段較長(cháng)的摸索期。

工具類(lèi)軟件更能被大家接受認可,微信中音頻轉文字功能用起來(lái)很方便,并且通過(guò)計算機的學(xué)習,準確度也在不斷提高。而科大訊飛推出的「訊飛聽(tīng)見(jiàn)」是目前將音頻轉文字業(yè)務(wù)做的較為成熟的平臺。業(yè)務(wù)細分為機器快轉和中文人工精轉兩種服務(wù),可直接收費變現。和百度地圖的定制版語(yǔ)音導航類(lèi)似,屬于上傳后的AI處理,非在線(xiàn)轉化。

地圖app,作為一個(gè)相對高頻使用的工具類(lèi)應用,除了在滿(mǎn)足常規通行服務(wù)外,正在發(fā)現更多的To C服務(wù)場(chǎng)景。比如google地圖推出的AR導航功能,已經(jīng)開(kāi)始測試應用,用于幫助用戶(hù)以在線(xiàn)實(shí)景增強的方式判斷方向及路線(xiàn)。華為也正在布局地圖服務(wù),在Cyberverse數據平臺上發(fā)了Map Kit,而相關(guān)AR技術(shù)的應用是在景區、博物館之類(lèi)的場(chǎng)景做實(shí)景增強標注和講解服務(wù)。在2017年高德地圖就推出了景區語(yǔ)音導游服務(wù),發(fā)展至今已經(jīng)比較成熟。

AI+音樂(lè ),在線(xiàn)音頻也一直被關(guān)注。今年7月抖音對外宣布了收購英國AI初創(chuàng )公司Jukedeck,這家公司正在研發(fā)一種技術(shù),將用人工智能創(chuàng )作音樂(lè ),對歌詞自動(dòng)配樂(lè )等方面。通過(guò)AI對音樂(lè )的深度學(xué)習,滿(mǎn)足用戶(hù)自由選擇音樂(lè )類(lèi)型、曲風(fēng)、時(shí)長(cháng)等要求,讓每一個(gè)用戶(hù)都能體驗到音樂(lè )創(chuàng )作的樂(lè )趣。

可以發(fā)現,相比5年前,AI合成技術(shù)已經(jīng)不再那么神秘。而那些曾經(jīng)“紅”極一時(shí)的深度偽造類(lèi)App,通常在道德、隱私、風(fēng)險等方面游走規則的邊緣,似乎滿(mǎn)足人們原始“窺視”、“色情”、“臆想”需求的功能成了火熱表相之下的底色,或許這并不是開(kāi)發(fā)者的初心,但是從環(huán)節上把控內容的方向,依舊很有必要。

另外隱私問(wèn)題開(kāi)始被用戶(hù)所注重,但是隨著(zhù)智能手機的普及應用,智能化的服務(wù)的增多,包括面部解鎖、刷臉交易、刷臉登陸等。過(guò)去很長(cháng)一段時(shí)間用戶(hù)對App應用上的用戶(hù)數據留痕,可能無(wú)暇顧及,但是當下面部信息已經(jīng)成為了個(gè)人服務(wù)的入口,并且直接關(guān)聯(lián)用戶(hù)隱私、數據信息以及財產(chǎn)的安全性。

總體來(lái)看,AI合成技術(shù)的工具類(lèi)應用是比較被用戶(hù)認可的,無(wú)論是功能性還是體驗度,相對傳統服務(wù)有了較大提升。專(zhuān)業(yè)技術(shù)對普通用戶(hù)的門(mén)檻正在降低,服務(wù)、效率、準確率、費用等因素會(huì )成為工具類(lèi)應用的競爭點(diǎn)。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。