打破16项AI性能记录!英伟达A100 GPU要无人能敌?
2020 年 7 月 30 日,MLPerf 組織發布第三個版本 MLPerf Training v0.7 基準測試(Benchmark)結果。結果顯示,英偉達基于今年 5 月最新發布的 Ampere 架構 GPU A100,和 HDR InfiniBand 實現多個 DGX A100 系統互聯的龐大集群——DGX SuperPOD 系統在性能上分別開創了八個全新里程碑,共打破 16 項紀錄。
打破 MLPerf Training 最新基準測試 16 項記錄
MLPerf 是 2018 年 5 月成立的行業基準測試組織,在 AI 備受關注的當下,獲得了芯片巨頭和 AI 芯片公司以及 AI 業界的廣泛關注。為了能夠讓機器學習處理器的基準測試也像 CPU 那樣,MLPerf 組織囊括了該行業中的所有知名企業和機構,比如英特爾、英偉達、Google、亞馬遜、阿里巴巴和百度、微軟、斯坦福大學等。
巨頭公司們樂于通過 MLPerf 的成績證明其 AI 實力,平頭哥在去年 11 月 MLPerf 首個版本基準測試成績公布之后就強調其自主研發的 AI 芯片含光 800 在 Resnet50 基準測試中獲得單芯片性能第一。
作為 AI 的領軍者,英偉達自然也不會錯過 MLPerf 的基準測試。2018 年 12 月,英偉達首次在 MLPerf 訓練基準測試中創下了六項紀錄,次年 7 月英偉達再次創下八項紀錄。在最新 MLPerf Training v0.7 基準測試中,有兩項新的測試和一項經大幅修訂的測試。
其中一項基準測試對推薦系統的性能進行了排名,推薦系統是日益普及的一項 AI 任務。另一項基準測試對使用 BERT 的對話式 AI 進行了測試,BERT 是現有最復雜的神經網絡模型之一。還有,強化學習測試中使用了 Mini-go 和全尺寸 19x19 圍棋棋盤,該測試是本輪最復雜的測試,內容涵蓋從游戲到訓練的多項操作。
特別值得一提的是,英偉達是唯一一家在 MLPerf Training v0.7 測試中均采用市售商用產品的公司。其他大多數提交使用的要么是預覽類別(preview category),其所用的產品預計需要幾個月后才會面市,使用研究類別的產品,更是較長一段時間內都不會面市。
另外,在此次提交結果的九家公司中,除英偉達外,還有六家公司多家生態系統合作伙伴也提交了基于英偉達 GPU 的 MLPerf 測試結果。包括三家云服務提供商(阿里云、谷歌云和騰訊云)和三家服務器制造商(戴爾、富士通和浪潮)。
18 個月內實現 AI 性能 4 倍提升
創造紀錄的英偉達 DGX SuperPOD 系統是基于 Ampere 架構以及 Volta 架構。雷鋒網(公眾號:雷鋒網)此前報道,5 月份發布的最近 Ampere 架構 GPU A100 基于臺積電 7nm 工藝,面積高達 826 平方毫米,集成了 540 億個晶體管。相比 Volta 架構實現了高達 20 倍的性能提升,并且可以同時滿足 AI 訓練和推理的需求。
A100 對比 V100
由 8 個安培 A100 GPU 打造的 NVIDIA DGX A100 AI 系統單節點性能達到了創紀錄的 5 petaflops。
此次,英偉達在 Selene 上運行了系統的 MLPerf 測試,Selene 是基于 DGX SuperPOD 的內部集群。DGX SuperPOD 是針對大規模 GPU 集群的公共參考架構,可在數周內完成部署。
根據測試結果,相較于首輪 MLPerf 訓練測試中使用的基于 V100 GPU 的系統,如今的 DGX A100 系統能夠以相同的吞吐率,在 18 個月內實現了 4 倍的性能提升。
能夠取得里程碑的成就除了強大的硬件,還有兩大關鍵——軟件和網絡連接。
A100 GPU 搭配 CUDA-X 庫的軟件更新,為通過 Mellanox HDR 200Gb/s InfiniBand 網絡構建的擴展集群提供支持。HDR InfiniBand 可實現極低的延遲和高數據吞吐量,同時通過可擴展分層聚合和縮減協議(SHARP)技術,提供智能深度學習計算加速引擎。
英偉達 A100 能否無人能敵?
英偉達 A100 發布之后,就有業內人士表示 GPU 的性能又上了一個臺階,AI 芯片初創公司想要超越英偉達的難度有增加了。
但相比硬件的超越,雷鋒網認為軟硬件生態才是巨頭公司更大的優勢所在。據悉,通過最新的軟件優化,基于 NVIDIA V100 的 DGX-1 系統也可實現 2 倍的性能提升。
就此次最新基準測試而言,提交了基于英偉達 GPU 的 MLPerf 測試結果的公司大多采用了英偉達的軟件中心 NGC 容易,以及用于參賽的公開框架。另外,包括這些 MLPerf 合作伙伴在內的近二十家云服務提供商和 OEM 組成的生態系統,已采用或計劃采用 A100 GPU 來打造在線實例、服務器和 PCIe 卡。
英偉達表示,A100 進入市場的速度也比以往英偉達的 GPU 更快,發布之初用于英偉達的第三代 DGX 系統,正式發布僅六周后,A100 就正式登陸了 Google Cloud 。
當然,英偉達也在通過更多行業軟件吸引用戶。比如今年 5 月,英偉達發布了兩個應用框架——用于對話式 AI 的 Jarvis 和用于推薦系統的 Merlin。還有面向汽車行業市場的 NVIDIA DRIVE,面向醫療健康市場的 Clara,面向機器人技術市場的 Isaac,以及面向零售/智能城市市場的 Metropolis。
性能和生態都足夠好的 A100,能讓英偉達在 AI 市場無人能敵嗎?價格會是阻礙嗎?
總結
以上是生活随笔為你收集整理的打破16项AI性能记录!英伟达A100 GPU要无人能敌?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 求一个qq二字网名男。
- 下一篇: 领域驱动设计之银行转账:Wow框架实战