NVIDIA再放“大招”，完美高机能计较界线

发布时间：2021-06-02 10:20:30 所属栏目：云计算来源：互联网

导读：高机能计较的飞速成长与应用遍及，为更多规模带来了庞大的动能。对付NVIDIA来说，其环绕GPU而睁开的一系列软硬件创新以及生态相助，让我们看到了NVIDIA深耕在高

新的参考计划平台：为Arm处事器提供GPU加快

在SC19上，NVIDIA宣布了一款参考计划平台，使企业可以或许快速构建GPU加快的Arm处事器，以满意日益多样化的科学和家产应用需求。该平台由硬件和软件基本模块构成，可以或许满意高机能计较（HPC）社区对付范例越发多样化的CPU架构日益增添的需求。通过该平台，超等计较中心、超大型云运营商和企业可以或许将NVIDIA加快计较平台的上风与最新的Arm处事器平台相团结。

为了构建这一参考平台，NVIDIA与Arm及其生态相助搭档（包罗Ampere、富士通和Marvell）联手，以确保NVIDIA GPU与Arm处理赏罚器之间的无缝协作。该参考平台还得益于与HPE旗下公司Cray和HPE这两家早期回收Arm处事器的供给商之间的细密相助。另外，很多高机能计较软件公司已行使NVIDIA CUDA-X库来构建可在Arm处事器上运行、并可通过GPU实现的打点和监控器材。

黄仁勋暗示：“高机能计较正在崛起。呆板进修和AI规模的打破正在从头界说科学研究要领，而且也许带来冲感民气的新架构。从超大局限云到百万兆级超等计较，NVIDIA GPU与ARM的组合让创新者们可以或许为不绝增进的新应用建设体系。”

宣布云上GPU超算：让每位科学家都能拥有一台超等计较机

会上，NVIDIA还宣布了在Microsoft Azure云上的一种新型GPU加快超等计较机。此次宣布的全新NDv2实例是Azure上局限最大的一次陈设，该产物专为处理赏罚要求苛刻的AI和高机能计较应用而计划，是环球速率最快的超等计较机之一。它能在一个Mellanox InfiniBand后端收集上提供多达800个互联的NVIDIA V100 Tensor Core GPU。

这是初次用户可以按照需求，在本身的桌面上租用整台AI超等计较机，并且其机能与那些必要数个月时刻才气完成陈设的大型当地超等计较机相匹配。

这款新产物异常合用于伟大的AI、呆板进修和高机能计较事变负载。对比基于CPU的传统计较，它具有明显的机能和本钱上风。对付必要快速办理方案的AI研究职员来说，它可以快速启动多个NDv2实例，并在短短几小时内完成伟大的会话式AI模子的实习。

此前，微软和NVIDIA的工程师已在该集群的预览版本上行使64个NDv2实例举办了尝试。他们用了约三小时完成了BERT会话式AI模子的实习。可以或许实现这一速率的缘故起因之一是行使了NCCL（一款NVIDIA CUDA X库）提供的多GPU优化以及高速Mellanox 互联办理方案。

另一个利益是客户可以行使多个NDv2实例运行伟大的高机能计较事变负载，好比LAMMPS，这是一种风行的分子动力学应用措施，用于在药物开拓和试探等规模中模仿原子级物质。对比于一个专用于特定应用措施（如深度进修）的、未行使GPU的 HPC计较节点，单个NDv2实例就能实现高达一个数目级的速率晋升。假如必要举办大局限的模仿，还可以将这一机能线性扩展至一百个实例。

全部NDv2实例都可以或许受益于NVIDIA NGC容器注册表和Azure Marketplace中所提供的TensorFlow、PyTorch和MXNet等GPU优化高机能计较应用、呆板进修软件及深度进修框架。该注册表还提供Helm图表，让用户在Kubernetes集群上可以轻松地陈设AI软件。

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

T前线云原生更改到底	几个步骤，协助你正确
如何为自己挑选合适的	改善云安全性的10条规