英偉達Ampere A100 GPU打破16條AI世界紀錄,比Volta V100快4.2倍

2020-08-01 11:11:52    來(lái)源:新經(jīng)網(wǎng)    作者:艾靜

NVIDIA剛剛發(fā)布了其Ampere A100 GPU的第一個(gè)實(shí)際性能數據,結果令人瘋狂。該公司在A(yíng)I特定基準測試中總共打破了16條性能記錄,并且在特定的機器學(xué)習性能類(lèi)別中擊敗了其主要競爭對手,取得了巨大的領(lǐng)先優(yōu)勢。

英偉達Ampere A100 GPU打破16條AI世界紀錄,比Volta V100快4.2倍

結果來(lái)自MLPerf.MLPerf是一家成立于2018年的行業(yè)基準測試組,主要專(zhuān)注于機器學(xué)習性能。該基準套件包括總共八項測試,并且NVIDIA已以創(chuàng )紀錄的培訓速度發(fā)布了所有記錄。

這是NVIDIA在2018年5月成立的行業(yè)基準測試組織MLPerf進(jìn)行的培訓測試中連續第三次,也是最強勁的表現。NVIDIA在2018年12月的首個(gè)MLPerf培訓基準中創(chuàng )下了六項記錄,在2019年7月創(chuàng )下了八項記錄。

NVIDIA是唯一一家為所有測試提供商用產(chǎn)品的公司。大多數其他提交使用的預覽類(lèi)別是可能幾個(gè)月不可用的產(chǎn)品,而研究類(lèi)別是使用預期時(shí)間不會(huì )可用的產(chǎn)品的。

英偉達Ampere A100 GPU打破16條AI世界紀錄,比Volta V100快4.2倍

NVIDIA博客

NVIDIA還報告了其DGX SuperPOD系統的八項新記錄,該系統是通過(guò)HDR InfiniBand連接在一起的龐大的DGX A100 HPC系統集群。DGX SuperPod由140個(gè)DGX A100系統組成,總共有1,120個(gè)NVIDIA Ampere A100 GPU,170個(gè)Mellanox Quantum 200G Infiniband交換機,4 PB的存儲空間和15公里的光纜。

令人贊嘆的DGX SuperPod系統中大約有770萬(wàn)個(gè)Ampere CUDA內核。該系統是DGX V擴展計劃的一部分,為該系統增加了近700 Petaflops的計算能力,該系統目前已部署在加利福尼亞州圣克拉拉市的NVIDIA總部。

人工智能性能基準-安培vs伏特&更多

NVIDIA已將其Ampere A100 Tensor Core GPU加速器與其前身Volta V100進(jìn)行了比較。比較還包括Google的第三代TPU和華為的Ascend HPC芯片。MLPerf本身列出了更詳細的基準測試,還預覽了即將推出的AI加速器,例如英特爾的Cooper Lake-SP Xeon CPU和Google的第四代TPU。話(huà)雖如此,讓我們看一下基準測試本身。

根據MLPerf的說(shuō)法,他們的基準套件包括針對機器學(xué)習和AI類(lèi)別中最相關(guān)的性能工作負載的測試。NVIDIA Ampere A100只是將Volta V100毀壞,而性能卻提高了2.5倍。即使以最低的領(lǐng)先優(yōu)勢,Ampele A100仍比Volta V100 GPU提升了50%,令人印象深刻。此處的芯片規模已標準化為單個(gè)GPU,以便在A(yíng)mpere和Volta之間進(jìn)行合理的比較。

華為Ascend芯片只能及時(shí)完成一項測試,而且性能也比Volta V100差,而Google的TPU V3只能及時(shí)完成兩項測試。在一項測試中,該芯片比NVIDIA Volta V100領(lǐng)先20%,而在第二項測試中,它比V100慢10%。

英偉達Ampere A100 GPU打破16條AI世界紀錄,比Volta V100快4.2倍

與Cooper Lake-SP 8插槽配置可在1104.53分鐘內完成圖像分類(lèi)測試相比,雙NVIDIA A100系統僅需33.37分鐘即可完成同一測試。NVIDIA還繼續將其Ampere A100的性能與尚未發(fā)布的Google TPU V4進(jìn)行比較,Google TPU V4仍處于研究階段,并且距離上市至少一年。

NVIDIA還展示了其GPU加速器的性能如何隨著(zhù)AI的最新全棧創(chuàng )新而不斷提高。與在Volta V100上運行的MLPerf 0.5相比,與Ampere A100一起運行的MLPerf 0.7套件提供了驚人的4.2倍性能提升。

這證明了NVIDIA Ampere A100 GPU的芯片在A(yíng)I社區中所有主要玩家認可的套件中的真實(shí)基準中的表現令人印象深刻。即使與Turing GPU相比,Ampele A100 GPU也被認為是另一個(gè)基準測試中最快的GPU,圖靈GPU的硬件加速技術(shù)能夠提供更好的性能,但仍然無(wú)法與Ampere A100及其強大的性能輸出相提并論。所有這些基準功能使我們更加高興地看到以消費者形式的安培,這肯定會(huì )在幾個(gè)月后發(fā)生。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。