<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

英偉達Ampere A100 GPU打破16條AI世界紀錄，比Volta V100快4.2倍

2020-08-01 11:11:52 來(lái)源：新經(jīng)網(wǎng) 作者：艾靜

NVIDIA剛剛發(fā)布了其Ampere A100 GPU的第一個(gè)實(shí)際性能數據，結果令人瘋狂。該公司在A(yíng)I特定基準測試中總共打破了16條性能記錄，并且在特定的機器學(xué)習性能類(lèi)別中擊敗了其主要競爭對手，取得了巨大的領(lǐng)先優(yōu)勢。

英偉達Ampere A100 GPU打破16條AI世界紀錄，比Volta V100快4.2倍

結果來(lái)自MLPerf.MLPerf是一家成立于2018年的行業(yè)基準測試組，主要專(zhuān)注于機器學(xué)習性能。該基準套件包括總共八項測試，并且NVIDIA已以創(chuàng )紀錄的培訓速度發(fā)布了所有記錄。

這是NVIDIA在2018年5月成立的行業(yè)基準測試組織MLPerf進(jìn)行的培訓測試中連續第三次，也是最強勁的表現。NVIDIA在2018年12月的首個(gè)MLPerf培訓基準中創(chuàng )下了六項記錄，在2019年7月創(chuàng )下了八項記錄。

NVIDIA是唯一一家為所有測試提供商用產(chǎn)品的公司。大多數其他提交使用的預覽類(lèi)別是可能幾個(gè)月不可用的產(chǎn)品，而研究類(lèi)別是使用預期時(shí)間不會(huì )可用的產(chǎn)品的。

英偉達Ampere A100 GPU打破16條AI世界紀錄，比Volta V100快4.2倍

NVIDIA博客

NVIDIA還報告了其DGX SuperPOD系統的八項新記錄，該系統是通過(guò)HDR InfiniBand連接在一起的龐大的DGX A100 HPC系統集群。DGX SuperPod由140個(gè)DGX A100系統組成，總共有1,120個(gè)NVIDIA Ampere A100 GPU，170個(gè)Mellanox Quantum 200G Infiniband交換機，4 PB的存儲空間和15公里的光纜。

令人贊嘆的DGX SuperPod系統中大約有770萬(wàn)個(gè)Ampere CUDA內核。該系統是DGX V擴展計劃的一部分，為該系統增加了近700 Petaflops的計算能力，該系統目前已部署在加利福尼亞州圣克拉拉市的NVIDIA總部。

人工智能性能基準-安培vs伏特&更多

NVIDIA已將其Ampere A100 Tensor Core GPU加速器與其前身Volta V100進(jìn)行了比較。比較還包括Google的第三代TPU和華為的Ascend HPC芯片。MLPerf本身列出了更詳細的基準測試，還預覽了即將推出的AI加速器，例如英特爾的Cooper Lake-SP Xeon CPU和Google的第四代TPU。話(huà)雖如此，讓我們看一下基準測試本身。

根據MLPerf的說(shuō)法，他們的基準套件包括針對機器學(xué)習和AI類(lèi)別中最相關(guān)的性能工作負載的測試。NVIDIA Ampere A100只是將Volta V100毀壞，而性能卻提高了2.5倍。即使以最低的領(lǐng)先優(yōu)勢，Ampele A100仍比Volta V100 GPU提升了50%，令人印象深刻。此處的芯片規模已標準化為單個(gè)GPU，以便在A(yíng)mpere和Volta之間進(jìn)行合理的比較。

華為Ascend芯片只能及時(shí)完成一項測試，而且性能也比Volta V100差，而Google的TPU V3只能及時(shí)完成兩項測試。在一項測試中，該芯片比NVIDIA Volta V100領(lǐng)先20%，而在第二項測試中，它比V100慢10%。

英偉達Ampere A100 GPU打破16條AI世界紀錄，比Volta V100快4.2倍

與Cooper Lake-SP 8插槽配置可在1104.53分鐘內完成圖像分類(lèi)測試相比，雙NVIDIA A100系統僅需33.37分鐘即可完成同一測試。NVIDIA還繼續將其Ampere A100的性能與尚未發(fā)布的Google TPU V4進(jìn)行比較，Google TPU V4仍處于研究階段，并且距離上市至少一年。

NVIDIA還展示了其GPU加速器的性能如何隨著(zhù)AI的最新全棧創(chuàng )新而不斷提高。與在Volta V100上運行的MLPerf 0.5相比，與Ampere A100一起運行的MLPerf 0.7套件提供了驚人的4.2倍性能提升。

這證明了NVIDIA Ampere A100 GPU的芯片在A(yíng)I社區中所有主要玩家認可的套件中的真實(shí)基準中的表現令人印象深刻。即使與Turing GPU相比，Ampele A100 GPU也被認為是另一個(gè)基準測試中最快的GPU，圖靈GPU的硬件加速技術(shù)能夠提供更好的性能，但仍然無(wú)法與Ampere A100及其強大的性能輸出相提并論。所有這些基準功能使我們更加高興地看到以消費者形式的安培，這肯定會(huì )在幾個(gè)月后發(fā)生。

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時(shí)間聯(lián)系我們修改或刪除，多謝。

標簽：芯片處理器英偉達

RM新时代投资官网

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<kbd id="ljlr3"><sub id="ljlr3"></sub></kbd>

<delect id="ljlr3"><noscript id="ljlr3"><cite id="ljlr3"></cite></noscript></delect>

<sup id="yepi4"><dl id="yepi4"></dl></sup>

<s id="yepi4"><form id="yepi4"><acronym id="yepi4"></acronym></form></s>

<p id="yepi4"></p>