鲲云科技宣布环球首款数据流AI芯片CAISA 打造更高算力性价比
副问题[/!--empirenews.page--]
6月23日动静,鲲云科技本日正式宣布环球首款数据流AI芯片CAISA,该芯片定位于高机能AI推理,今朝已完成量产。 据先容,鲲云通过自主研发的数据流技能在芯片实测算力上实现了技能打破,较同类产物在芯片操作率上晋升了10倍。第三方测试数据表现仅用1/3的峰值算力,CAISA芯片可以实现英伟达同类产物最高3.91倍的实测机能。 鲲云科技创立于2016年,聚焦于基于数据流架构的定制AI计较引擎,其自主研发的CAISA架构已有近三十年技能蕴蓄。鲲云科技今朝已经完成了天使轮,A轮及A+轮融资,并在深圳、山东、伦敦研发中心。 此刻,详细来看看这款数据流AI芯片CAISA的机能示意。 超高芯片操作率,定制数据流芯片架构完成3.0进级 此次宣布的CAISA芯片回收鲲云自研的定制数据流芯片架构CAISA 3.0,相较于上一代芯片架构,CAISA3.0在架构服从和实测机能方面有了大幅的晋升,并在算子支持上越发通用,支持绝大大都神经收集模子快速实现检测、分类和语义支解陈设。CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大进步,在AI芯片内,每一个CAISA都可以同时处理赏罚AI事变负载,进一步晋升了CAISA架构的机能,在峰值算力晋升6倍的同时保持了高达95.4%的芯片操作率,实测机能线性晋升。同时新一代CAISA架构对编译器RainBuilder的支持越发友爱,软硬件协作进一步优化,在体系级别上为用户提供更好的端到端机能。 CAISA3.0架构图 CAISA3.0架构继承保持在数据流技能蹊径的环球领先职位,指令集架构回收冯诺依曼计较方法,通过指令执行序次节制计较次序,并通过疏散数据搬运与数据计较提供计较通用性。CAISA架构依托数据流活动序次节制计较序次,回收计较流和数据流重叠运行方法消除空闲计较单位,并回收动态设置方法担保对付人工智能算法的通用支持,打破指令集技能对付芯片算力的限定。此次进级,CAISA架构办理了数据流架构作为人工智能计较平台的三大焦点挑衅: 高算力性价比:在保持计较正确条件下,通过不绝压缩每个空闲时钟推高芯片实测机能以靠近芯片物理极限,让芯片内的每个时钟、每个计较单位都在执行有用计较; 高架构通用性:在担保每个算法在CAISA上运行可以或许实现高芯片操作率的同时,CAISA3.0架构通用支持全部主流CNN算法; 高软件易用性:通过专为CAISA定制的编译器材链实现算法端到端自动陈设,用户无需底层数据流架构配景常识,简朴两步即可实现算法迁徙和陈设,低落行使门槛。 详细来讲,鲲云CAISA3.0架构的三大技能打破首要通过以下的技能方法实现: 高算力性价比:时钟级精确的计较 CAISA3.0架构由数据流来驱动计较进程,无指令操纵,可以实现时钟级精确的计较,最大限度的镌汰硬件计较资源的空闲时刻。CAISA3.0架构通过数据计较与数据活动的重叠,压缩计较资源的每一个空闲时钟;通过算力资源的动态均衡,消除流水线的机能瓶颈;通过数据流的时空映射,最大化复用芯片内的数据流带宽,镌汰对外部存储带宽的需求。上述计划使CNN算法的计较数据在CAISA3.0内可以实现不中断的一连运算,最高可实现95.4%的芯片操作率,在平等峰值算力前提下,可得到相对付GPU 3倍以上的实测算力,从而为用户提供更高的算力性价比。 高架构通用性:流水线动态重组 CAISA3.0架构可以通过流水线动态重组实现对差异深度进修算法的高机能支持。通过CAISA架构层的数据流引擎、全局数据流网、全局数据流缓存,以及数据流引擎内部的人工智能算子模块、局部数据流网、局部数据流缓存的分层计划,在数据流设置器节制下,CAISA架构中的数据流毗连相关和运行状态都可以被自动化动态设置,从而天生面向差异AI算法的高机能定制化流水线。在担保高机能的条件下,支持用户行使基于CAISA3.0架构的计较平台实现如方针检测、分类及语义支解等普及的人工智能算法应用。 高软件易用性:算法端到端自动化陈设 RainBuilder编译器材链 专为CAISA3.0架构配备的RainBuilder编译器材链支持从算法到芯片的端到端自动化陈设,用户和开拓者无需相识架构的底层硬件设置,简朴两步即可实现算法快速迁徙和陈设。RainBuilder编译器可自动提取主流AI开拓框架(TensorFlow,Caffe,Pytorch,ONNX等)中开拓的深度进修算法的收集布局和参数信息,并面向CAISA布局举办优化;器材链中的运行时(Runtime)和驱动(Driver)模块认真硬件打点并为用户提供尺度的API接口,运行时可以基于准确的CAISA机能模子,实现算法向CAISA架构的自动化映射,同时提供可以被高级说话直接挪用的API接口;最底层的驱动可以实现对用户透明的硬件节制。RainBuilder器材链行使简朴,陈设利便,通用性强,可以让用户快速和低本钱的陈设和迁徙已有算法到CAISA硬件平台上。 首款量产数据流AI芯片,CAISA带来AI芯片研发新偏向 CAISA-定制数据流AI芯片 作为环球首款回收数据流技能的AI芯片,CAISA搭载了四个CAISA3.0引擎,具有高出1.6万个MAC(乘累加)单位,峰值机能可达10.9TOPs。该芯片回收28nm工艺,通过PCIe3.0×4接口与主处理赏罚器通讯,同时具有双DDR通道,可为每个CAISA引擎提供高出340Gbps的带宽。 CAISA芯片架构图 作为一款面向边沿和云端推理的人工智能芯片,CAISA可实现最高95.4%的芯片操作率,为客户提供更高的算力性价比。CAISA芯片具有精采的通用性,可支持全部常用AI算子,通过数据流收集中算子的差异设置和组合,CAISA芯片可支持绝大大都的CNN算法。针对CAISA芯片,鲲云提供RainBuilder3.0器材链,可实现推理模子在芯片上的端到端陈设,使软件工程师可以利便的完成CAISA芯片在AI应用体系中的集成。 鲲云科技宣布数据流CAISA芯片 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |