英偉達在首個(gè)MLPerf推理基準測試中名列前茅

2020-01-17 15:31:48    來(lái)源:    作者:

MLPerf聯(lián)盟的第一個(gè)基準測試結果已經(jīng)發(fā)布,Nvidia顯然是推理性能的贏(yíng)家。

對于那些不知道的人,推理采用了深度學(xué)習模型并處理傳入的數據,但是經(jīng)過(guò)了訓練。

英偉達在首個(gè)MLPerf推理基準測試中名列前茅

MLPerf是一個(gè)聯(lián)盟,旨在為推理性能提供“公平且有用的”標準化基準??梢詫LPerf視為推斷SPEC在基準CPU和總體系統性能方面所做的工作。

該聯(lián)盟已經(jīng)發(fā)布了首個(gè)基準測試結果,這是一項艱苦的工作,涉及30多家公司以及200多名工程師和從業(yè)人員。MLPerf的首次征集征集活動(dòng)導致對14個(gè)公司和44個(gè)系統進(jìn)行了600多次測量。

英偉達在首個(gè)MLPerf推理基準測試中名列前茅

但是,對于數據中心推斷,只有四個(gè)處理器在商業(yè)上可用:

英特爾至強P9282

哈瓦那·戈雅(Habana Goya)

谷歌TPUv3

Nvidia圖靈

Nvidia毫不猶豫地在服務(wù)器和離線(xiàn)情況下?lián)魯「鞣N神經(jīng)網(wǎng)絡(luò )中的其他三個(gè)處理器擊敗其他三個(gè)處理器:

在ImageNet ResNet-50 v1.6脫機方案中,最主要的參與者和初創(chuàng )公司提交的結果最多,因此可以進(jìn)行最簡(jiǎn)單的直接比較。

在這種情況下,英偉達再次憑借其Titan RTX GPU在每個(gè)處理器上擁有最佳性能。盡管使用8個(gè)Intel Skylake處理器提交了2倍的Google Cloud TPU v3-8,但其性能卻與使用4枚Titan RTX卡的SCAN 3XS DBP T496X2 Fluid相似(65,431.40 vs. 66,250.40輸入/秒)。

NVIDIA總經(jīng)理兼加速計算副總裁Ian Buck說(shuō):

英偉達在首個(gè)MLPerf推理基準測試中名列前茅

“人工智能正處于轉折點(diǎn),因為它已從研究迅速遷移到針對實(shí)際應用的大規模部署。

AI推理是一個(gè)巨大的計算挑戰。NVIDIA將業(yè)界最先進(jìn)的可編程加速器,CUDA-X AI算法套件以及我們在A(yíng)I計算方面的深厚專(zhuān)業(yè)知識相結合,可以幫助數據中心部署龐大且不斷增長(cháng)的復雜AI模型。”

但是,值得注意的是,Titan RTX不支持ECC內存,因此盡管具有出色的性能,但這種遺漏可能會(huì )阻止它在某些數據中心中的使用。

將Cloud TPU結果與Nvidia進(jìn)行比較時(shí),另一個(gè)有趣的收獲是從脫機到服務(wù)器方案的性能差異。

離線(xiàn)Google Cloud TPU v3:32,716.00

Google Cloud TPU v3服務(wù)器:16,014.29

Nvidia SCAN 3XS DBP T496X2離線(xiàn)流體:66,250.40

Nvidia SCAN 3XS DBP T496X2流體服務(wù)器:60,030.57

如您所見(jiàn),在服務(wù)器方案中使用時(shí),Cloud TPU系統性能降低了一半以上。相比之下,SCAN 3XS DBP T496X2流體系統性能僅下降約10%。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。