很多朋友不知道【中國首次!阿里HappyHorse-1.0登頂LM Arena視頻編輯榜】,今天小綠就為大家解答一下。
LM Arena是全球AI社區公認的權威盲測評估平臺,采用匿名對比投票機制,由用戶(hù)在不知道模型歸屬的前提下進(jìn)行偏好投票,并通過(guò)Elo評分體系生成排名。此次上榜的HappyHorse-1.0隸屬阿里巴巴ATH(Alibaba Token Hub)事業(yè)群,組織代號為Alibaba-ATH。

【CNMO科技消息】4月15日,權威AI模型評測平臺LM Arena公布最新Video Edit(視頻編輯)方向排行榜。阿里巴巴ATH事業(yè)群旗下模型HappyHorse-1.0以1299分的Elo評分位列榜首,超越xAI的Grok Imagine Video(1257分),成為該榜單該方向首個(gè)由中國團隊獲得的第一。

阿里巴巴
版權所有,未經(jīng)許可不得轉載 CNMO注意到,這并非HappyHorse首次在權威盲測中登頂。此前,HappyHorse系列模型已在A(yíng)rtificial Analysis的Video Arena榜單中以匿名身份登頂文生視頻和圖生視頻雙賽道,超越字節跳動(dòng)Seedance 2.0、快手可靈3.0、Google Veo 3 Fast等國內外頭部模型。在該平臺的文本轉視頻(無(wú)音頻)賽道中,HappyHorse跑出1409分的高分,刷新該榜歷史紀錄,領(lǐng)先第二名字節跳動(dòng)Seedance 2.0約110分;在圖像轉視頻(無(wú)音頻)賽道中,領(lǐng)先第二名48分。 據悉,HappyHorse-1.0采用150億參數的40層單流自注意力Transformer架構,實(shí)現了原生音視頻同步生成。與主流視頻生成模型“先出無(wú)聲視頻、后配樂(lè )對口型”的多工序流程不同,該模型將視頻和音頻的生成合并進(jìn)一個(gè)流程,一次前向推理直接輸出帶聲音的成片,無(wú)需任何后期拼接。同時(shí),模型原生支持英語(yǔ)、普通話(huà)、粵語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)和法語(yǔ)七種語(yǔ)言的唇形同步。
HappyHorse
以上問(wèn)題已經(jīng)回答了。如果你想了解更多,請關(guān)
新經(jīng)網(wǎng)網(wǎng)站 (
http://www.hkkqyy120.com/)