加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

大数据和呆板进修AI芯片:GPU vs FPGA 云和当地陈设的艰巨选择

发布时间:2018-09-01 00:25:50 所属栏目:云计算 来源:云技术实践
导读:GPU和FPGA怎样辅佐执行数据麋集型使命,譬喻操纵,说明和呆板进修,以及有哪些选择? 应用措施和基本架构在慢慢成长。这是人工智能再生的期间,基本办法既可以使人工智能应用措施领略天下,也可以不绝成长以更好地满意需求。 凡是环境下,我们已经假想了为
副问题[/!--empirenews.page--]

GPU和FPGA怎样辅佐执行数据麋集型使命,譬喻操纵,说明和呆板进修,以及有哪些选择?

应用措施和基本架构在慢慢成长。这是人工智能再生的期间,基本办法既可以使人工智能应用措施领略天下,也可以不绝成长以更好地满意需求。

凡是环境下,我们已经假想了为AI应用措施提供动力的新基本架构,而且在它完全成熟之前给出了名称 ------ Infrastructure 3.0。我们也开始试探仓库中多方面构成部门,包罗哪些明明的、不那么明明的,以及其他部门。

为了易于叙述,本文将聚焦“具有很多计较焦点和高带宽内存的专用硬件”,简称AI芯片。我们来看看这些AI芯片如安在数据库和说明以及呆板进修(ML)方面使以数据为中心的使命受益。

让我们从GPU和FPGA来开启这篇文章的先容。

GPU

图形处理赏罚单位(GPU)已经存在了一段时刻。最初计划是用于满意快速渲染的需求,首要用于游戏行业,GPU的架构已被证明可以或许与呆板进修精采匹配。

GPU的并行处理赏罚,这也是CPU可以做的工作,但与通用CPU相反,GPU的专业性使它们可以或许跟上摩尔定律的速率继承成长。Nvidia是GPU规模的首要参加者,最近公布了一套基于Turing架构的新GPU。

为停止裁减,新的Nvidia GPU现实上带来了图形渲染的改造。可是,更重要的是,为了契合需求,他们网络了Tensor Cores,这是该公司专门的呆板进修架构,并先容了NGX。NGX是一种技能,正如Nvidia所说,它将人工智能引入图形管道:“NGX技能带来了诸如回收尺度摄像机输入和建设超等慢举措等成果,就像你行使一个代价10万美元以上的专用摄像机那样。” 

人们一样平常不会对通用呆板进修(ML)感乐趣,但新Nvidia卡的成果必定能引起人们的存眷。然而,它的价值也反应了产物的高端品格,从2.5K到10K美元不等。

13

GPU可以极大地加快事变负载,这些事变负载可以解析,并行执行,与CPU协同事变。图片:SQream。

可是,操作GPU,不只必要硬件架构 ---- 它还必要软件。对付Nvidia来说,这是有利的竞争身分,而对付像AMD这样的竞争者来说却显然倒霉。Nvidia在行使GPU举办呆板进修应用方面遥遥领先的缘故起因在于行使GPU所需的库(CUDA和cuDNN)。

AMD固然也有一个可以与AMD GPU一路行使的更换软件层,称为OpenCL,但它的成熟度和支持措施与Nvidia的库另有差距。AMD正在全力迎头遇上,它也在硬件方面睁开机关。

为了从AI芯片中受益,AMD所需的投资超出了硬件。急切必要一个位于这些芯片之上的软件层,以优化在其上运行的代码。没有它,它们险些无法行使。可是,这也必要行使者进修怎样行使这一层。

上面,我们已经提到GPU怎样成为ML事变负载的首选AI芯片。最受接待的ML库支持GPU - Caffe,CNTK,DeepLearning4j,H2O,MXnet,PyTorch,SciKit和TensorFlow等。除了必要相识每个库的细节之外,凡是还必要构建GPU情形。

至于平凡的数据操纵和说明 -----GPU数据库方面,已经开拓出一类新的数据库体系,其方针是操作GPU并行性,将现成硬件的上风带入主流应用措施开拓。这个规模可以选择BlazingDB,Brytlyt,Kinetica,MapD,PG-Strom和SQream。

FPGA

现场可编程门阵列(FPGA)并不是新的产物----自80年月起就存在。它们背后的首要头脑是,与其他芯片相反,可以按需从头设置。读者也许更想知道这是怎样实现的,怎样更专业化,以及有什么用处。

FPGA可以简朴地被以为是包括初级芯片基本的电路板,譬喻AND和OR门。凡是行使硬件描写说话(HDL)指定FPGA设置。行使此HDL,可以以切合特定使命或应用措施要求的方法设置基本架构,实质上是仿照特定应用集成电路(ASIC)。

因为必需通过HDL为每个差异的应用措施从头编程,芯片听起来很伟大。因此,软件层至关重要。按照Tirias Research首席说明师Jim McGregor的说法,“构建FPGA的器材集有些迂腐。Nvidia在行使GPU时很好地操作了CUDA说话。操作FPGA,如故是一种有用构建算法的黑马。”

14

英特尔很是重视FPGA,也许是为了补充其在GPU中落伍的大势。但FPGA软件层还没有GPU那样成熟。图像:英特尔

但上面这种环境正在清静产生改变。最初是英特尔对FPGA暗示了乐趣,收购了Altera(要害的FPGA制造商之一)。这也许是英特尔推进AI芯片天下的计谋,这一点在与GPU竞争中处于劣势之后将变得越来越重要。可是,抛开伟大性,FPGA有竞争力吗?

英特尔最近宣布了针对NVIDIA Titan X Pascal GPU在两代英特尔FPGA(英特尔Arria10和英特尔Stratix 10)上评估新兴深度进修(DL)算法的研究成就。这项研究的要点是,当行使紧充数据范例与完备32位浮点数据(FP32)时,英特尔Stratix 10 FPGA优于GPU。

这意味着只要行使低精度数据范例,英特尔的FPGA就可以与GPU竞争。听起来很糟糕,但它现实上是DL的新兴趋势。来由是简化计较,同时保持可较量的精确性。

将FPGA用于呆板进修(ML)有光亮远景。然而,本日,成长并不是那么顺遂。在验证McGregor的声明时,好像没有一个支持FPGA的ML库开箱即用。今朝正在开展行使TensorFlow实现FPGA的事变,但除此之外险些没有什么其他器材。

然而,在数据操纵和说明方面,环境有所差异。最近,英特尔展示了其与FPGA加快说明相助的一些相助搭档。 Swarm64看有望为PostgreSQL,MariaDB和MySQL加快12次。其它,rENIAC可以提供Cassandra的13倍加快版本,以及Algo-Logic及其定制键值存储。

在云端和当地陈设中决议

选用何种新兴技能很难决议,硬件也不破例。项目研发中,是应该构建本身的基本架构,照旧行使云?是应该比及产物变得越发成熟再行使,照旧当纵然用产物,成为早期回收者而受益?是选择GPU,照旧FPGA?是选择哪个GPU或FPGA供给商?

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读