厨房中的NVIDIA GTC 2020演讲 黄仁勋奉上了哪些劲爆“料理”?
副问题[/!--empirenews.page--]
至顶网计较频道 05月15日 消息动静(文/李祥敬):众所周知的缘故起因,本年许多厂商的年度勾当由于疫情缘故起因纷纷打消了线下勾当,而是改为线上进行。同样,备受等候的NVIDIA GTC 2020也将勾当搬到了网上,推出了GTC Digital,可是其时我们等候的NVIDIA CEO黄仁勋老师的主题演讲并没有呈此刻GTC Digital日程中,或者是因为不确定性的疫情环境。 就在昨天北京时刻5月14日晚九点,黄仁勋的NVIDIA GTC 2020演讲在厨房中进行。在此次主题演讲前,NVIDIA就宣布了一个三十几秒的预热视频,视频中黄仁勋从烤箱中取出了一个巨型产物,号称是天下上最大的GPU。 就在昨天的正式宣布中,这款产物的面纱被解开,那就是基于NVIDIA Ampere架构的GPU——NVIDIA A100。在全新Ampere架构的GPU牵引下,NVIDIA公布了在数据中心、AI、HPC、边沿智能、自主呆板、自动驾驶、图形渲染等规模的一系列的更新。 全新架构 全新特征凭证NVIDIA产物架构的更新节拍,本年的Ampere架构备受等候。着实在正式发布之前,网上相干的信息已经铺天盖地了,这也看出了业界对付新架构的存眷水平。 在硬件架构层面,NVIDIA Ampere GPU回收了7纳米制程工艺,包括高出540亿个晶体管,这样的数据足以令人乍舌。而NVIDIA普及回收的Tensor Core焦点也得到了更新,具有TF32的第三代Tensor Core焦点能在无需变动任何代码的环境下,使FP32精度下的AI机能进步多达20倍。另外,Tensor Core焦点此刻支持FP64精度,对比于前代,其为HPC应用所提供的计较力比之条件高了多达2.5倍。 同时,全新Ampere架构搭载了多实例GPU(MIG)、第三代NVIDIA NVLin、布局化稀少等技能。个中MIG技能可以将单个A100 GPU支解为多达七个独立的GPU,为差异局限的事变提供差异的计较力,以此实现最佳操作率和投资回报率的最大化。而第三代NVIDIA NVLink使GPU之间的高速联接增进至原本的两倍,实现处事器的高效机能扩展。第三代NVIDIA NVLink互联技能可以或许将多个A100 GPU归并成一个庞大的GPU来执行更大局限的实习使命。 得益于其诸多创新,NVIDIA A100荟萃了AI实习和推理,其机能对比于前代产物晋升了高达20倍。 数据中心场景产物更新从NVIDIA的最新财报可以看到,数据中心营业在NVIDIA的营收中的比重越来越高。而在数据中心机关方面,NVIDIA也在不绝深入扩展。 基于NVIDIA A100,NVIDIA推出了全新的NVIDIA DGX A100体系和HGX A100处事器构建模块。个中,DGX A100体系具有高达5Petaflops的AI机能,集成了8个全新NVIDIA A100 Tensor Core GPU,具有320GB内存用以实习最大型的AI数据集,以及最新的高速NVIDIA Mellanox HDR 200Gbps互连。 一个由5台DGX A100体系构成的机架可取代一个包罗了AI实习和推理基本办法的数据中心,并且功耗仅是其1/20,所占用的空间是其1/25,本钱是其1/10。操作A100的多实例GPU成果,每台DGX A100体系可以或许被支解为多达56个实例,用于加快多个小型事变负载的处理赏罚速率。依附这些成果,企业可在一个完全集成的软件界说平台上按照本身的需求优化计较力和资源,加速数据说明、实习和推理等各类事变负载的速率。 据悉,DGX A100体系首批订单将送往美国能源部的阿贡国度尝试室(Argonne National Laboratory)。该尝试室将运用该集群的AI和计较力来更好地研究和应对COVID-19。 NVIDIA还展示了新一代DGX SuperPOD并宣布了DGX SuperPOD参考架构。该集群由140台DGX A100体系构成, AI计较手段高达700Petaflops。操作Mellanox HDR 200Gbps InfiniBand互连技能,NVIDIA将140台DGX A100体系团结在一路,构建了DGX SuperPOD AI超等计较机。 另外,NVIDIA还推出了NVIDIA DGXpert打算,辅佐DGX客户与NVIDIA的AI专家成立接洽;尚有NVIDIA DGX-Ready软件打算,辅佐客户在AI事变流程中充实操作各类颠末认证的企业级软件。 硬件的更新是一方面,软件与硬件的协同才气施展最大代价。NVIDIA还宣布了多个软件仓库更新,使应用措施开拓者可以或许充实验展A100 GPU的机能。这些更新包罗了50多个新版本CUDA-X库,可用于加快图形、模仿和AI;CUDA 11;多模态对话式AI处事框架NVIDIA Jarvis;深度保举应用框架NVIDIA Merlin;NVIDIA为Apache Spark 3.0带来端到端的GPU加快;以及NVIDIA HPC SDK,个中包罗可以或许辅佐HPC开拓者调试和优化A100代码的编译器、库和器材。 边沿AI平台更新除了数据中心产物的更新,NVIDIA也更新了EGX边沿AI平台产物:合用于较大型贸易通用处事器上的EGX A100和合用于微型边沿处事器的微型EGX Jetson Xavier NX。 EGX A100是首个基于NVIDIA Ampere架构的边沿AI产物。EGX A100团结了NVIDIA Ampere架构与NVIDIA Mellanox ConnectX-6 Dx SmartNIC,能将尺度型和专用型的边沿处事器转变为极具安详性的云原生AI超等计较机。 而EGX Jetson Xavier NX是环球体积最小、机能最强盛的AI超等计较机,可以或许在15W功率下提供最高21TOPS的计较力,或在10W功率下提供最高14TOPS的计较力,合用于微型处事器和边沿智能物联网盒。 配套硬件,NVIDIA推出了NVIDIA Jetson Xavier NX开拓者套件。另外,EGX边沿AI平台的云原生架构使其可以运行容器化的软件,以支持一系列GPU加快的事变负载。NVIDIA应用框架包罗了用于医疗规模的Clara、用于电信规模的Aerial、用于对话式AI规模的Jarvis、用于呆板人技能规模的Isaac,以及用于零售、伶俐都市、交通等规模的Metropolis。 自动驾驶NVIDIA DRIVE强势进级跟着NVIDIA Ampere架构的推出,NVIDIA DRIVE平台获得了进一步的扩展,实现了从入门级ADAS办理方案到L5级自动驾驶出租车(Robotaxi)体系的全方位机能晋升。此次扩展的范畴从NCAP五星ADAS体系到DRIVE AGX Pegasus Robotaxi平台。后者配备两个Orin SoC和两块NVIDIA Ampere GPU,可实现亘古未有的每秒2000万亿次运算,高出上一代平台机能的6倍。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |