NVIDIA赵立威:RAPIDS加快平台,从开源社区中来,到开源社区中去
【51CTO.com原创稿件】早年各人都当数据科学家,由于数据科学家不是在喝咖啡,就是在喝咖啡的路上。事实,数据加载的进程很是漫长,必要很长时刻举办数据下载、数据抽取、数据转换等等。不外,有了全新的GPU加快平台后,数据科学家也许就会兴奋不起来了,由于这将大大镌汰他们喝咖啡的时刻。虽然,对付IT manager可能企业打点者来说,是极大的利好动静。 在本年10月10日的GTC欧洲大会上,NVIDIA正式宣布了新的GPU加快平台:RAPIDS。 赵立威,NVIDIA亚太区办理方案架构高级总监 在本周NVIDIA北京办公室进行的RAPIDS媒体雷同会上,NVIDIA亚太区办理方案架构高级总监赵立威暗示,当前我们已经进入了数据驱动的期间,任何决定的制订都必要数据支撑。假如必要耗费数十个小时乃至几天、周周的时刻来说明数据,对付决定者来说简朴是无法容忍的。 50倍的加快 RAPIDS的三大要害词是:面向数据科学和呆板进修、软件平台、开源。 赵立威暗示,险些每家企业都在操作数据驱动营业成长,一旦分开数据,零售、互联网等任何行业和规模的贸易举动,将不行想像。因此,秒级乃至毫秒级的数据说明手段,至关重要。 RAPIDS就是但愿辅佐企业以“亘古未有”的速率说明海量数据并举办精准的营业猜测,用户只必要举办很是小代码的变革量,就可以或许带来50倍的加快,这给数据科学家带来了极大的信念。 据先容,最初的RAPIDS基准说明操作了XGBoost呆板进修算法在NVIDIA DGX-2TM体系长举办实习,功效表白与仅有CPU的体系对比其速率能加速50倍。他可以或许辅佐数据科学家将典范实习时刻从数天镌汰到数小时,可能从数小时镌汰到数分钟——详细取决于其数据集的局限。 赵立威暗示,假如用户想领会RAPIDS的上风,出格是大型项目所能带来的上风,可以先从DGX station这种小型的可以放在脚边的呆板开始试用。可是,想要体验在出产情形中的机能,就必要用DGX-2这种可以或许带来50倍加快体验的产物,很是令人震惊。 今朝,除了DGX-2、DGX-1、DGX station等硬件产物支持RAPIDS之外,基于NVIDIA HGX-1、HGX-2这两种架构的硬件产物均提供对RAPIDS加快的支持。另外,NVIDIA浩瀚相助的ODM、OEM厂商提供的一些硬件产物,也开始支持RAPIDS。 完全开源的软件平台 RAPIDS是一个软件平台,并且是一个完全开源的软件平台。 在GTC欧洲大会上黄仁勋曾在演讲中先容,RAPIDS构建于Apache Arrow、pandas和 scikit-learn等风行的开源项目之上,为最风行的Python数据科学器材链带去GPU提速。 据相识,为了将更多的呆板进修库和成果引入RAPIDS, NVIDIA 普及地与开源生态体系孝顺者睁开相助 ,个中包罗 Anaconda、BlazingDB、 Databricks、Quansight、scikit-learn、Ursa Labs 认真人兼Apache Arrow创造者Wes McKinney,以及敏捷增添的Python数据科学库pandas等等。为了敦促RAPIDS的普及应用,英伟达也全力将RAPIDS与Apache Spark举办整合,后者是说明及数据科学方面领先的开源框架。 赵立威暗示,RAPIDS的开源有两层寄义,第一个寄义是嗣魅整个RAPIDS是NVIDIA跟全部的开源社区相助,不管是SPARK、PYTHON、APACHE ARROW照旧DASK,NVIDIA都与他们保持着很是细密的相助。第二,RAPIDS平台自己是开源的,我们但愿通过这种方法吸引更多开源的伴侣参加进来,孝顺他们的代码、孝顺他们的伶俐,不绝的完美整个平台上的创新、富厚上面的基本特征,处事我们更多的场景。 因此,RAPIDS是从开源社区中来,到开源社区中去。 【51CTO原创稿件,相助站点转载请注明原文作者和出处为51CTO.com】 【责任编辑:张诚 TEL:(010)68476606】点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |