加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

打破MLPerf基准测试16项AI性能纪录 NVIDIA迎来AI全新里程碑

发布时间:2020-08-28 16:48:27 所属栏目:大数据 来源:网络整理
导读:至顶网计较频道 07月30日 消息动静(文/李祥敬):当前,AI芯片的成果日益伟大化、多样化,一方面,芯片厂商纷纷给出差异的权衡尺度,声称其产物在计较机能、单元能耗算力等方面处于行业领先程度;另一方面,用户却体谅怎样能从厂商给出的信息中判定出芯片
副问题[/!--empirenews.page--]

至顶网计较频道 07月30日 消息动静(文/李祥敬):当前,AI芯片的成果日益伟大化、多样化,一方面,芯片厂商纷纷给出差异的权衡尺度,声称其产物在计较机能、单元能耗算力等方面处于行业领先程度;另一方面,用户却体谅怎样能从厂商给出的信息中判定出芯片是否能现实满意其真实场景的计较需求。

因此,创立于2018年5月的行业基准测试组织MLPerf推出了MLPerf基准测试,MLPerf基准测试是业内首套权衡呆板进修软硬件机能的通用基准,即实习过的神经收集在差异量级的装备(物联网、智妙手机、PC、处事器)、各类应用(自动驾驶、NLP、计较机视觉)上处理赏罚新数据的速率。MLPerf现有50多家成员,包罗谷歌、微软、Facebook、阿里巴巴等企业,以及斯坦福、哈佛、多伦多大学等高校,并跟从AI的成长步骤一连演进。

冲破MLPerf基准测试16项AI机能记载 NVIDIA迎来AI全新里程碑

按照克日宣布的MLPerf基准测试功效表现,内置高出2000个NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD在市售商用产物中脱颖而出,在各项针对大局限计较机能的MLPerf基准测试中均取得了优秀后果。此次已是NVIDIA在MLPerf实习测试中持续第三次揭示了最强劲的机能。2018年12月,NVIDIA初次在MLPerf实习基准测试中创下了六项记载,次年7月NVIDIA再次创下八项记载。

NVIDIA在测试顶用到的产物基于最新NVIDIA Ampere架构以及Volta架构。A100 Tensor Core GPU在加快器的所有八项MLPerf基准测试中揭示了最快的机能。在实现总体最快的大局限办理方案方面,操作HDR InfiniBand实现多个DGX A100体系互联的复杂集群——DGX SuperPOD体系在机能上,也开创了八项全新里程碑。

NVIDIA是独逐一家在全部测试中均回收市售商用产物的公司。其他大大都提交行使的要么是预览种别(preview category),其所用的产物估量必要几个月后才谋面市,要么行使的是研究类此外产物,更是较长一段时刻内都不谋面市。

速率与局限兼得的DGX SuperPOD架构

冲破MLPerf基准测试16项AI机能记载 NVIDIA迎来AI全新里程碑

NVIDIA在Selene上运行了体系的MLPerf测试,Selene是基于DGX SuperPOD的内部集群。DGX SuperPOD是针对大局限GPU集群的民众参考架构,NVIDIA DGX SuperPOD基于NVIDIA DGX A100体系。NVIDIA DGX A100在一台6U处事器中集成了8颗A100 GPU以及NVIDIA Mellanox HDR InfiniBand收集技能,可觉得高机能计较、数据说明和AI事变(包罗实习和推理)等多种组合提供加快,并实现快速陈设。

Selene最近在TOP500榜单中初次表态,依附百亿亿次(exaflops)级此外AI机能,成为美国最快的家产体系。它也是Green500榜单中环球第二大节能体系。除了精彩的能效示意,Selene的快速陈设手段也是令人另眼相看。工程师们可以行使NVIDIA的模块化参照架构,在不到附近的时刻内就能快速构建Selene。4名操纵职员仅需不到1个小时,就能组装起一套由20台体系构成的DGX A100集群,建设出一套机能可以到达2petaflops的体系。

今朝,客户已经回收这些参考架构来构建自身的DGX POD和DGX SuperPOD。个中包罗美国最快的学术规模AI超等计较机HiPerGator,该超等计较机也将成为佛罗里达大学跨学科AI创新的基石。

冲破MLPerf基准测试16项AI机能记载 NVIDIA迎来AI全新里程碑

同时,环球领先的超算中心Argonne国度尝试室正在行使DGX A100,探求抗击COVID-19疫情的要领。Argonne国度尝试室是六个首批回收A100 GPU的高机能计较中心中的先行者之一。

DGX SuperPOD现已助力汽车规模的大陆团体、航空航天规模的Lockheed Martin和云计较处事规模的微软等公司取得了精采的营业成就。这些体系的顺遂运转,部门得益于其普及的生态体系对付NVIDIA GPU和DGX支持。

软硬团结一年半内实现4倍机能晋升

MLPerf最新基准测试包括两项新的测试和一项经大幅修订的测试。NVIDIA在这三项测试中均取得了优秀的后果。个中,一项基准测试对保举体系的机能举办了排名。保举体系是日益遍及的一项AI使命。另一项基准测试对行使BERT的对话式AI举办了测试。BERT是现有最伟大的神经收集模子之一。最后,强化进修测试中行使了Mini-go和全尺寸19x19围棋棋盘。该测试是本轮最伟大的测试,内容涵盖从游戏到实习的多项操纵。

冲破MLPerf基准测试16项AI机能记载 NVIDIA迎来AI全新里程碑

最新功效表白,NVIDIA聚焦于不绝成长跨处理赏罚器、收集、软件和体系的AI平台。譬喻,测试功效表现,相较于首轮MLPerf实习测试中行使的基于V100 GPU的体系,现在的DGX A100体系可以或许以沟通的吞吐率,实现高达4倍的机能晋升。同时,得益于最新的软件优化,基于NVIDIA V100的DGX-1体系亦可实现高达2倍的机能晋升。

冲破MLPerf基准测试16项AI机能记载 NVIDIA迎来AI全新里程碑

不到两年,整个AI平台的创新就取得了云云优秀的后果。现在,NVIDIA A100 GPU搭配CUDA-X库的软件更新,为通过Mellanox HDR 200Gb/s InfiniBand收集构建的扩展集群注入了强劲动力。HDR InfiniBand可实现极低的耽误和高数据吞吐量,同时通过可扩展分层聚合和缩减协议(SHARP)技能,提供智能深度进修计较加快引擎。

NVIDIA Ampere市场回收速率革新记载

A100是首款基于NVIDIA Ampere架构的处理赏罚器。得益于其诸多创新,NVIDIA A100荟萃了AI实习和推理,其机能对比于前代产物晋升了高达20倍。

NVIDIA Ampere GPU回收了7纳米制程工艺,包括高出540亿个晶体管,这样的数据足以令人乍舌。而NVIDIA普及回收的Tensor Core焦点也得到了更新,具有TF32的第三代Tensor Core焦点能在无需变动任何代码的环境下,使FP32精度下的AI机能进步多达20倍。另外,Tensor Core焦点此刻支持FP64精度,对比于前代,其为HPC应用所提供的计较力比之条件高了多达2.5倍。

同时,全新Ampere架构搭载了多实例GPU(MIG)、第三代NVIDIA NVLin、布局化稀少等技能。个中MIG技能可以将单个A100 GPU支解为多达七个独立的GPU,为差异局限的事变提供差异的计较力,以此实现最佳操作率和投资回报率的最大化。而第三代NVIDIA NVLink使GPU之间的高速联接增进至原本的两倍,实现处事器的高效机能扩展。第三代NVIDIA NVLink互联技能可以或许将多个A100 GPU归并成一个庞大的GPU来执行更大局限的实习使命。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读