CPU加GPU组合拳:AMD发布Instinct MI100加速显卡 给客户提供多样性选择
AMD不止一次暗示:Zen奠基了AMD将来几年产物的蹊径图,现现在,“Zen”这把火已经在CPU市场越烧越旺。 比拟CPU架构Zen,AMD的GPU 架构则显得没有那么亮眼,曾经的“GCN”已经逐步退出汗青舞台,而AMD在GPU规模的新一轮机关才方才开始。客岁,AMD推出了为游戏所计划的专用图形架构RDNA;本年,AMD则推出了专门为高机能计较所打造CDNA架构,而且在近期宣布了首款基于全新CDNA架构的Instinct MI100加快显卡。 众所周知,AMD是天下上独逐一家在CPU跟GPU上都做到行业标杆的企业,在高机能计较规模,AMD的CPU与GPU的产物组合又会给客户带来哪些惊喜呢? AMD高级副总裁兼处事器营业总司理Dan McNamara暗示,在高机能计较方面,整个行业成长异常敏捷。我们看到的趋势是,事变负载的多样性在不绝增进,高机能计较已经进入到许多规模,包罗从传统科研,情景研究,生命科学,电子计划自动化到贸易应用,从AI、呆板进修到算法培训等等,怎样通过CPU和GPU方面的组合更好地处事于客户、为客户带来更多单元整天机能和镌汰总体拥有本钱,将是AMD极其重要的计谋之一。 CDNA架构Instinct MI100加快显卡 迫近百亿亿次级计较期间 在整个已往20年里,整个高机能计较经验了三个阶段,别离是TERASCALE、PETASCALE和此刻的EXASCALE。在这个进程中我们必要一系列技能来支持EXASCALE这样一个百亿亿次级计较。 AMD平台办理方案工程研发环球副总裁Brad Mccredie暗示,(如上图所示)我们可以看到靠近EXASCALE的时辰,所需机能速率是放慢的趋势,没有步伐用很快的速率到达百亿亿次级的成长。基于此,AMD推出了CDNA架构Instinct MI100加快显卡,这款GPU产物可以或许实现10TF(十万亿次双精度计较速率),具备Matrix焦点技能,它可以或许进一步迫近百亿亿次级的运算期间。 与AMD上一代产物对比有着庞大的机能晋升,AMD Instinct MI100可以或许实现高达70%的AI计较增强;而与竞争敌手对比,在每单元机能上也是对方的两倍。出格是在搭配第二代AMD EPYC处理赏罚器行使时,还可为体系提供更强的加快机能。 以AMD Instinct MI100为例,CDNA架构可在统一晶片上放入了两倍数目的计较单位,并可以嵌入微架构以更好的顺应AI和高机能计较的事变负载。同时在16位浮点计较和殽杂精度计较方面也能实现7倍以上的机能晋升,其它通过Infinity架构还可以将GPU的带宽晋升4倍、通过HBM2内存来实现20%的位宽晋升。 据Brad Mccredie先容,AMD与4家顶级体系厂商在亲近共同,将于本月开始延续发货。 开源软件站ROCm 4.0 为百亿亿次级计较提供了新基本 天下级硬件(AMD Instinct MI100),也必要天下级生态来做配套,AMD推出了开源软件站ROCm 4.0。该平台不只相较上两代产物,可实现MI100高达5-8倍的机能晋升,还可为开拓者们提供简朴快捷的代码迁徙成果,乃至最短1天就可完成某些代码的迁徙事变。 Brad Mccredie暗示,它(开源软件站ROCm 4.0)是一套不绝壮大的生态体系,从成果上来说也很是完美,已经做好了企业级客户的陈设停当,为百亿亿次级计较提供了新基本。 AMD Instinct MI100落地应用 尚有与霄龙的搭配组合 AMD分享了一系列AMD Instinct MI100落地应用。据先容,橡树岭国度尝试室就通过行使MI100来举办相干事变负载,在分子动力学负载中,与v100加快显卡对比速率晋升3倍。而在Fluid Turbulence的事变负载中,也比v100加快显卡有2.6倍的速率上风。 Dan McNamara增补了CGG以及ECMWF的应用,CGG是一家地球科学公司,他们行使霄龙CPU和MI100 GPU来辅佐他们做地动成效以及更好的决定。在情景建模方面,欧洲的ECMWF操作霄龙处理赏罚器打造天下最强的情景建模的超算之一。他暗示,AMD近期有许多客户乐成案例,也表现了霄龙处理赏罚器和AMD GPU产物在整个高机能计较市场的庞大乐成。 打造出巨大的产物——这是苏姿丰博士在上任之初为AMD筹划出的将来计谋之一,AMD也一向朝着既定的方针提高,在企业级市场,不管是CPU(霄龙)照旧GPU(MI100),AMD都拿出了让客户满足的产物。AMD也一向蹂躏实地,用产物赢得客户的心,这才是AMD的制胜之道。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |