NVIDIA推出兩款全新的Ampere Tensor Core GPU:用于數據中心的A10 24 GB GDDR6和A30 24 GB HBM2

2021-04-13 18:39:19    來(lái)源:新經(jīng)網(wǎng)    作者:文靜

除了所有CPU和GPU公告外,NVIDIA今天還發(fā)布了其全新的基于A(yíng)mpere的A10和A30 Tensor Core GPU。這兩個(gè)GPU面向數據中心,并且主要面向虛擬化平臺。

NVIDIA推出兩款全新的Ampere Tensor Core GPU:用于數據中心的A10 24 GB GDDR6和A30 24 GB HBM2

這些全新的Tensor Core GPU有趣的是它們的規格。A10使用GA102 GPU,而A30使用GA100 GPU。雖然這兩個(gè)都是基于A(yíng)mpere的,但兩個(gè)GPU的內存子系統都將大不相同,因為提供GDDR6的A10和提供數據中心的標準HBM2內存標準的A30。因此,讓我們詳細了解一下規格。

NVIDIA A10 Tensor Core GPU由GA102-890 SKU驅動(dòng)。它具有72個(gè)SM,共計9216個(gè)CUDA內核。GPU的基本時(shí)鐘頻率為885 MHz,最高可提升至1695 MHz。它具有PCIe Gen 4.0合規性,并且在內存方面具有24 GB GDDR6 VRAM,可在384位寬的總線(xiàn)接口上以12.5 Gbps的速度運行。GPU提供600 GB / s的帶寬。

至于卡的設計,它使用了香檳金色外罩,采用單槽,全長(cháng)尺寸。由于這是一個(gè)被動(dòng)冷卻卡,因此它上沒(méi)有風(fēng)扇,并且通過(guò)單個(gè)8針連接器提供電源,并且該卡通過(guò)單個(gè)8針連接器運行,從而滿(mǎn)足其150W TDP需求。在性能方面,NVIDIA A10 Tensor Core GPU最多可提供31.2 TF FP32、62.5 TF TF32、125 TF BFLOAT16、250 TOPS INT8、500 TOPS INT4以及兩倍的稀疏率。

NVIDIA A30 Ampere Tensor Core GPU

另一方面,NVIDIA A30 Tensor Core GPU使用GA100 SKU,但尚不知道確切的變種。這似乎是一個(gè)相當精簡(jiǎn)的變體,具有930 MHz的基本時(shí)鐘和高達1440 MHz的升壓時(shí)鐘。GPU配備了24 GB的HBM2 VRAM,可在3072位寬的總線(xiàn)接口上以1215 MHz的速度運行。這意味著(zhù)我們僅查看三個(gè)活動(dòng)的HBM2存儲器堆棧。堆??商峁└哌_933 GB / s的內存帶寬。

與A10不同,NVIDIA A30 Tensor Core GPU具有雙插槽和全長(cháng)設計。它也由單個(gè)8針連接器供電,但額定TDP更高,為165W。在性能方面,NVIDIA A30 Tensor Core GPU提供高達5.2 TF FP64、10.3 TF Peak FP64TF,10.3 TF FP32、82 TF TF32、165 TF BFLOAT16、330 TOPS INT8、661 TOPS INT4以及兩倍的稀疏率。

NVIDIA Tensor Core Ampere GPU
  A10 A30
顯卡 GA102-890 GA100
FP64 5.2兆
FP64張量核心 10.3兆
FP32 31.2兆 10.3兆
TF32張量核心 62.5 teraFLOPS |125 teraFLOPS * 82 teraFLOPS |165 teraFLOPS *
BFLOAT16張量核心 125 teraFLOPS |250 teraFLOPS * 165 teraFLOPS |330 teraFLOPS *
FP16張量核心 125 teraFLOPS |250 teraFLOPS * 165 teraFLOPS |330 teraFLOPS *
INT8張量核心 250 TOPS |500 TOPS * 330 TOPS |661 TOPS *
INT4張量核心 500 TOPS |1,000 TOPS * 661 TOPS |1321 TOPS *
RT核心 72個(gè)RT內核
編碼/解碼 1個(gè)編碼器
2個(gè)解碼器(+ AV1解碼)
1個(gè)光流加速器(OFA)
1個(gè)JPEG解碼器(NVJPEG)
4個(gè)視頻解碼器(NVDEC)
GPU內存 24GB GDDR6 24GB HBM2
GPU內存帶寬 600GB /秒 933GB /秒
互連線(xiàn) PCIe Gen4 64GB /秒 PCIe Gen4:64GB / s
第三代NVLINK:200GB / s **
外形尺寸 單槽全高全長(cháng)(FHFL) 雙插槽,全高,全長(cháng)(FHFL)
最大散熱設計功率(TDP) 150瓦 165瓦
多實(shí)例GPU(MIG) 4個(gè)GPU實(shí)例@每個(gè)6GB每個(gè)
2個(gè)GPU實(shí)例@每個(gè)12GB每個(gè)
1個(gè)GPU實(shí)例@ 24GB
vGPU軟件支持 NVIDIA虛擬PC,NVIDIA虛擬應用程序,NVIDIA RTX虛擬
工作站,NVIDIA虛擬計算服務(wù)器
適用于VMware
NVIDIA Virtual Compute Server的NVIDIA AI Enterprise

浪潮支持A30,A10和A100的全新GPU服務(wù)器

超靈活的AI工作負載,支持2個(gè)Intel第三代Intel Xeon可擴展處理器和8個(gè)NVIDIA A100 / A40 / A30 GPU,16個(gè)NVIDIA A10 GPU或20個(gè)NVIDIA T4 GPU;在4U機箱中最多支持12個(gè)3.5英寸硬盤(pán)驅動(dòng)器,用于大型本地存儲;靈活適應最新的AI加速器和智能NIC,并具有一鍵式切換拓撲的獨特功能,適用于各種AI應用程序,包括AI云,IVA(智能視頻分析),視頻處理等。

NF5468A5:

多功能AI服務(wù)器,具有2個(gè)AMD Rome / Milan CPU和8個(gè)NVIDIA A100 / A40 / A30 GPU;N + N冗余設計可在全速運行中使用8個(gè)350W AI加速器,從而具有出色的可靠性;CPU到GPU的非阻塞設計允許在不進(jìn)行PCIe交換機通信的情況下進(jìn)行互連,從而實(shí)現更快的計算效率。

NF5280M6:

專(zhuān)為所有場(chǎng)景而打造,在2U機箱中配備2個(gè)Intel第三代Intel Xeon可擴展處理器和4個(gè)NVIDIA A100 / A40 / A30 / A10 GPU或8個(gè)NVIDIA T4 Tensor Core GPU,能夠在45°下長(cháng)期穩定運行C。NF5280M6配備了最新的PFR / SGX技術(shù)和可信賴(lài)的安全模塊設計,適用于要求苛刻的AI應用。

此外,浪潮還宣布了全新的浪潮M6 AI服務(wù)器,完全支持NVIDIA Bluefield-2 DPU。展望未來(lái),浪潮計劃將NVIDIA Bluefield-2 DPU集成到其下一代AI服務(wù)器中,這將為AI,大數據分析,云計算等場(chǎng)景提供更快,更高效的用戶(hù)和集群管理以及互連的數據訪(fǎng)問(wèn)。和虛擬化。

可用性

全球計算機制造商現已提供20多個(gè)NVIDIA認證系統。具有NVIDIA A30和NVIDIA A10 GPU的NVIDIA認證系統將于今年晚些時(shí)候從制造商處上市。

NVIDIA AI Enterprise是永久許可,每個(gè)CPU插槽的價(jià)格為3,595美元。NVIDIA AI Enterprise的企業(yè)業(yè)務(wù)標準支持費用為每個(gè)許可每年899美元??蛻?hù)可以在計劃升級到VMware vSphere 7 Update 2時(shí)申請NVIDIA AI Enterprise的早期訪(fǎng)問(wèn)。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。