威盛x86 AI处理器架构、性能公布:媲美Intel 32核心
新处理赏罚器回收台积电16nm工艺制造,内核面积不高出195平方毫米,内部回收环形总线计划,串联集成八个x86 CPU焦点、16MB共享三级缓存、四通道DDR4-3200内存节制器、PCIe 3.0节制器(44条)、南桥和IO成果,是一颗完备的SoC。 最大亮点是AI协处理赏罚器“NCORE”,占用面积约34.4平方毫米(17.6%),软件映射为PCI装备,支持DNN深度神经收集建设与实习的加快,号称可提供多达20TB/s的内存带宽、每秒20万亿次AI操纵的机能。 主频可以事变在2.5GHz,并且竟然支持AVX-512指令集,这然则AMD Zen 2架构都没有的。 CHA处理赏罚器内核图 CHA处理赏罚器模块简图 克日,Centaur发布了这颗处理赏罚器的诸多架构细节,但风趣的是并非自行发布,而是来自美国加州处理赏罚器技能势力巨子机构、 闻名芯片杂志《Microprocessor Report》刊行商Linley Group,后者细心研究了Centaur的处理赏罚器架构计划文档,并采访了相干计划师,给出了这份陈诉。 《Microprocessor Report》杂志主编Linley Gwennap对这颗全新计划的x86处理赏罚器不惜溢美之词:“Centaur高调重返x86市场,带来了刷新的处理赏罚器计划,整个八个高机能CPU焦点、一个定制深度进修加快器(DLA)。这是业界第一个集成DLA的处事器处理赏罚器计划。新的加快器NCore的神经收集机能乃至比最强盛的至强还要好,并且不必要昂贵的外部GPU计较卡帮助。” Linley Group透露,Centaur的全新x86微架构叫做“CNS”,计划方针是IPC要高于传统PC处理赏罚器,每时钟周期可解码4条x86指令,并行执行10个微操,首颗处理赏罚器暂定名“CHA”,个中AI协处理赏罚器INT8整数的峰值机能高达20TOPS(20万亿次操纵每秒)。 CNS微架构图 NCore AI协处理赏罚器架构图 Linley Group基于势力巨子的MLPerf机能测试来权衡x86处理赏罚器的AI机能,功效发明Centaur CHA处理赏罚器的AI推理机能,相等于23个天下级的Intel x86焦点,并且后者必需是支持512位的VNNI矢量神经收集指令才行。——究竟上,Intel此刻还没有真正的32焦点产物。 Centaur AI协处理赏罚器的架构计划相同VNNI指令的SIMD(单指令大都据)理念,可是在16MB专用内存、20TB/s带宽的支持下,每个时钟周期可以处理赏罚32768个数据位,并且将推理处理赏罚交给专门的AI协处理赏罚器后,x86焦点就可以安心执行其他通用使命。 Centaur还为开拓者提供了新的算法,可充实操作Centaru AI协处理赏罚器无与伦比的超低推理耽误,并与x86 CPU焦点亲近共同。 在纽约州举行的ISC East大会上,Centaur还初次果真展示了CHA处理赏罚器,并且除了视频说明、及时物体检测和分类等传统AI应用之外,还独一秀了一把语义支解(像素级图像分类)、人体姿态预计(简笔画)等前沿应用,让人大开眼界。 今朝,Centaur正在改造优化新平台的硬件机能、软件服从,而新处理赏罚器估量来岁下半年正式投产。 Linley Group的具体陈诉可以点击这里下载 差异CPU架构的比拟
本文素材来自互联网 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |