寒武纪副总裁刘道福:算力是人工智能的第一敦促力
进入2000年后,因为互联网企业的崛起,互联网巨头可以或许拥有大量的算力和数据,用于神经收集这类算力麋集型和数据麋集型的算法研究,神经收集从头抖擞了第三春,而且降生了比传统浅层神经收集(两三层)层数多许多的深度神经收集,层数高达上千层。 这些深度神经收集的表述手段比传统浅层神经收集好许多,可以办理越发伟大的题目。 因此,深度神经收集很快在2012年后慢慢成为呆板进修主流算法,而且迅猛成长,很快在包罗计较机视觉、语音辨认、天然说话等规模成为了主流。 人工智能有三个很重要的身分:数据、算法、算力。 数据是人工智能的出产资料,没有好的数据,无论算法多好,也很难加工出来好的模子。 算法是人工智能的魂灵,好的算法,能把好的数据举办加工(实习),获得一个好的模子,对付新的数据举办更好的猜测。 算力是人工智能的出产力,因为数据量越来越大,算法越来越伟大,必要很是很是高的算力支撑。就像人类社会前进必要出产力敦促一样,算力是敦促人工智能成长的第一敦促力。 人工智能为什么必要一些专门的处理赏罚器呢?从汗青成长来讲也可以看到一些眉目,传统在80年月、90年月全部的运算都是节制为主的运算可能文本处理赏罚,CPU就够了。 到90年月,图形界面的呈现、游戏的呈现,呈现了图形渲染等这些新的的计较需求,原本的CPU处理赏罚这些计较太低效,本钱太高,速率太慢,呈现了针对图形界面和图像渲染的图形处理赏罚器(Graphics Processing Unit, GPU)。 人工智能计较特点相对图形渲染的计较,有一些新的特点,图像渲染以向量为主,可是人工智能计较每每是三维矩阵可能更高维运算为主,以是必要纷歧样架构的处理赏罚器来支撑人工智能这一类的计较。 陪伴着人工智能的成长和应用,2000年后,人工智能芯片也开始获得学术界和财富界的存眷。寒武纪在这个规模做的很早,我们在2008年在相干规模举办学术研究,2016年创立公司举办真正的财富落地。 作为一家芯片公司,我们存眷整小我私人工智能的角度与各人也许轻微纷歧样,我们存眷的是差异应用场景对算力的需求。 好比说对付物联网规模,算力需求不会那么大,可是对功耗要求很高,但愿做到极低功耗,这个场景对算力的要求每每小于1Tops。对移动斲丧电子,好比手机可能VR、AR装备,算力要求和详细场景有相关,1-20Tops的算力要求都有。 而对付一些要害及时应用,好比自动驾驶规模,取决于自动驾驶程度(Level)纷歧样,算力范畴变革是很大的,也许从20-2000TOPS。 有概念以为,自动驾驶每往上升一个Level,所必要的算力会增进5~10倍。Level 2的自动驾驶典范算力要求为20~30TOPS。 其它一个要害场景就是互联网、数据中心的应用,这个场景,取决于营业局限的巨细,也许从POPS到EOPS不等。 人工智能成长傍边,数据促进了IT技能厘革以及人工智能落地。由于数据越多,所必要处理赏罚的范例越来越富厚,从而敦促了许多新需求、许多新应用诞的生。 其它,人工智能成长的另一个趋势,就是终端与云端的接洽越来越细密。在终端,因为越来越多传感器被陈设,越来越多的数据必要被处理赏罚,必要举办推理。 而这些推理,又每每依靠于云端,一方面,推理所必要的模子,每每必要终端数据搜集到云端,举办标注和实习获得。另一方面,终端因为受限于计较力和存储容量,对付一些伟大推理应用,必要云端的算力举办支撑。 人工智能芯片要做到“好用”与“通用”,要办理一系列题目和挑衅。寒武纪在这方面,做了许多实行和事变。 起首在处理赏罚器指令和架构计划方面,我们从应用需求出发,说明和抽取应用负载特性,基于这些特性计划机动指令集,提供机动的运算器方案,以及可扩展性强、高效架构。 在详细产物落地上,寒武纪通过机动和富厚的软件栈支持主流编程框架,并在大局限商用中获得反馈和批改,低落了乐成智能芯片的开拓本钱,加快了人工智能芯片的落地。 在现实的人工智能处理赏罚器计划进程中,回收传统ASIC芯片计划思绪,也即直接将算法硬件化,存在三大抵牾和挑衅必要降服。 第一个有限局限的硬件和恣意局限的算法的抵牾,硬件受限于物理限定,所能同时处理赏罚的算礼貌模是受限的。 第二个是布局牢靠的硬件和变化多端的算法的抵牾,芯片和硬件的迭代速率较慢,周期较长,而算法迭代速率极快,同时统一时期的算法自己也是有各类百般的算法,怎样通过一个布局的芯片或硬件支持各类时期,各类变革的算法,是个重大的挑衅。 第三个是能耗受限的硬件和计较劲大的算法,因为处理赏罚数据的人工智能算法越来越伟大,以及所必要处理赏罚的数据量越来越大,所必要的算力也越来越大,对计较的本钱提出了很大的挑衅,计较所必要的电力本钱升高及厥后头的基本办法制作城市是一个重要的承担,因此,在现实落地中,企业每每对付人工智能硬件功耗提出了各类限定,各类要求。 寒武纪在计划人工智能芯片进程中,回收了一系列技能来降服上述挑衅,包罗集成大量片内SRAM,神经元假造化,通用机动的人工智能指令集,以及对稀少神经收集的专门支持等技能。 在产物计谋上,寒武纪僵持云边端一体成长、协同成长,僵持推理和实习,云端、边沿和终端形成一系列产物矩阵,实现AI应用的全场景包围。我们在终端、云端、边沿都有差异条理的产物。 在终端,因为产物形态很是变化多端,我们回收的IP授权的方法,把我们的AI手段赋能于种种终端SOC厂商,包罗手机、摄像头SOC芯片厂商。 在云端,我们直接提供芯片、板卡和软件栈,直接处事于互联网和行业巨头、数据中心。在边沿,我们界说的边沿计较是边沿网关侧的计较,我们也提供了专门的芯片和小尺寸加快卡,赋能于边沿计较的各行各业。 本年6月,我们宣布了第二代云端推理芯片,思元270,在浓密的神经收集处理赏罚上,对比前一代有4倍的机能晋升。最近,我们也推出了面向边沿计较规模的思元220芯片和M.2加快卡。 思元220是一款专门用于深度进修的边沿加快芯片,回收TSMC 16nm工艺,它具有小尺寸、高算力、低功耗和富厚的I/O接口等特点。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |