GPU云处事器深度进修机能模子初探
从MXNet的测试功效来看,对付PennTreeBank这样局限的数据集,2vCPU 1GB Mem就能满意实习需求。因为天然说话处理赏罚的原始数据不像图像分类一样是大量高清图片,天然说话处理赏罚的原始数据以文本文件为主,因此天然说话处理赏罚对内存和显存的要求都不高,从我们的测试来看,4vCPU 30GB 1GPU规格根基满意实习阶段需求。 5.2 推理 5.2.1 图像分类 从NVCaffe的图像分类推理测试来看,除AlexNet 2vCPU方才够用外,其余收集2vCPU对机能没有影响,而9.4GB的验证数据集推理进程中内存占用或许是7GB阁下,因此对大部门模子来看,2vCPU 30GB 1GPU规格根基满意图像分类推理的机能需求。 对付磁盘IO机能,推理机能NVMe SSD当地皮、SSD云盘很靠近,但高效云盘差15%。因此推理阶段至少应该行使SSD云盘担保机能。 5.2.2 天然说话处理赏罚 对付天然说话处理赏罚,参考实习机能需求,我们应该可以展望2vCPU 30GB 1GPU规格应该也能满意需求。 5.3 数据预处理赏罚 从NVCaffe对ImageNet ILSVRC2012数据集做数据预处理赏罚的测试来看,数据预处理赏罚阶段是IO麋集型,NVMe SSD当地皮比SSD云盘快25%,而SSD云盘比高效云盘快10%。 六、总结 深度进修框架浩瀚,神经收集范例也是种类繁多,我们选取了主流的框架和神经收集范例,实行对单机GPU云处事器的深度进修机能模子做了起源的说明,结论是: 深度进修实习阶段是GPU运算麋集型,对付CPU占用不大,而内存的需求取决于深度进修框架、神经收集范例和实习数据集的巨细;对磁盘IO机能不敏感,云盘根基可以或许满意需求。 深度进修推理阶段对付CPU的占用更小,可是对付磁盘IO机能相对较敏感,由于推理阶段对付耽误有必然的要求,更高的磁盘IO机能对付低落数据读取的延时进而低落整体耽误有很大的辅佐。 深度进修数据预处理赏罚阶段是IO麋集型阶段,更高的磁盘IO机能可以或许大大收缩数据预处理赏罚的时刻。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |