华为AI实习集群Atlas900有多快?算力相等于50万台PC
网易科技讯 9月18日动静,华为全联接2019大会上,华为副董事长胡厚崑宣布了Atlas 900 AI实习集群。此次宣布的Atlas 900 AI实习集群由数千颗昇腾910 AI处理赏罚器互联组成,是当前环球最快的AI实习集群,代表了当今环球的算力顶峰。其总算力到达256P~1024P FLOPS @FP16,相等于50万台PC的计较手段。 AI算力领先 Atlas 900 AI实习集群回收业界单芯片算力最强的昇腾910 AI处理赏罚器,每颗昇腾910 AI处理赏罚器内置32个达芬奇AI Core,单芯片提供比业界高一倍的算力。Atlas 900 AI实习集群将数千颗昇腾910 AI处理赏罚器互联,打造业界第一的算力集群。 昇腾910 AI处理赏罚器回收SoC计划,集成“AI算力、通用算力、高速大带宽I/O”,大幅度卸载Host CPU的数据预处理赏罚使命,充实晋升实习服从。 最佳集群收集 Atlas 900 AI实习集群回收“HCCS、 PCIe 4.0、100G以太”三类高速互联方法,百TB全互联无阻塞专属参数同步收集,低就逮络时延,梯度同步时延收缩10~70%。 在AI处事器内部,昇腾910 AI处理赏罚器之间通过HCCS高速总线互联;昇腾910 AI处理赏罚器和CPU之间以最新的PCIe 4.0(速度16Gb/s)技能互联,其速度是业界主流回收的PCIe 3.0(8.0Gb/s)技能的两倍,使得数据传输越发快速和高效。在集群层面,回收面向数据中心的CloudEngine 8800系列互换机,提供单端口100Gbps的互换速度,将集群内的全部AI处事器接入高速互换收集。 独创iLossless 智能无损互换算法,对集群内的收集流量举办及时的进修实习,实现收集0丢包与E2E μs级时延。 体系级调优 Atlas 900 AI实习集群通过华为荟萃通讯库和功课调治平台,整合HCCS、 PCIe 4.0和100G RoCE三种高速接口,充实开释昇腾910 AI处理赏罚器的强盛机能。 华为荟萃通讯库提供实习收集所需的漫衍式并行库,通讯库+收集拓扑+逊?с法举办体系级调优,实现集群线性度>80%,极大晋升了功课调治服从。 散热体系 传统数据中心多以风冷技能对装备举办散热,但在人工智能期间传统数据中心却面对很是大的挑衅。高功耗器件好比CPU和AI芯片带来更大的热岛效应要求更高效的冷却方法。液冷技能可以满意数据中心高功率、高密陈设、低PUE的超高需求。 Atlas 900 AI实习集群回收全液冷方案,创新性计划业界最强柜级密闭绝热技能,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1.1的极致数据中心能源服从。 其它,在空间节减方面,与8kW风冷机柜对比,节减机房空间79%。极致的液冷散热技能满意了高功率、高密装备陈设、低PUE的需求,极大地低落了客户的TCO。
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |