加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

阿里巴巴机器智能团队的三年工作总结

发布时间:2019-05-22 23:25:58 所属栏目:建站 来源:汪思颖
导读:本文转自雷锋网,如需转载请至雷锋网官网申请授权。 从 2016 年至今,阿里巴巴呆板智能尝试室线下智能团队开始涉足线下智能规模。试探至今,算法方面,他们提出了自主研发的模子压缩要领,新型模子布局和方针检测框架;工程方面,他们研发出一套非数据依靠

FPGA 上的推理框架由处事器研发团队完成。ResNet18 收集的推理时刻只必要 0.174ms,今朝已知业内最佳机能。在边沿计较产物 alibabaedge 上,基于硬件实现的高效算子,推理速率为边沿 GPU 的两倍。在后头,我们会团结产物形态整体的先容这一方案。

GPU

falcon_conv 是呆板智能技能团队开拓的一款由 CUDA C++编写,在 Nvidia GPU 上运行的低精度卷积库,它接管 2 份低精度(INT8)张量作为输入,将卷积功效以 float/int32 数据输出,同时支持卷积后一些通例操纵(scale,batchnorm,relu… )的归并。我们在单张 Tesla P4 GPU 上,对 falcon_conv 的机能与 Nvidia 官方计较库 Cudnn v7.1 做了较量,如图所示。险些全部环境 falcon_conv 都优于 Cudnn,个体用例有高至 5 倍的晋升,用例选自 RESNET 和 VGG 中耗时较多的卷积参数。

阿里巴巴呆板智能尝试室线下智能团队三年岁情总结

产物化

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读