弥合AI大规模落地的巨大缺口!阿里、腾讯、百度等联合推出互联网服务AI基准
端到端应用基准由四个模块构成:线上处事器、离线说明器、查询天生器和数据存储,如图 2 所示。 图 2:AIBench 实现 在线处事器(Online server) 吸取查询哀求,然后团结 AI 推理举办本性化搜刮和保举。 离线说明器(Offline analyzer) 选择恰当的 AI 算法实现,并举办实习以天生进修模子。另外,离线说明器还认真构建数据索引以加快数据会见。 查询天生器(Query generator) 模仿并发用户,并按照特定的设置将查询哀求发送到线上处事器。作者实现了基于 JMeter 的查询天生器。 数据存储模块(Data storage module) 存储各类数据,包罗布局化、非布局化和半布局化数据,以及各类数据源,包罗表格、文本、图像、音频和视频。 3.1.1 在线处事器 在线处事器团结传统的呆板进修和深度进修技能提供本性化的搜刮和保举。在线处事器由四个子模块构成,包罗搜刮打算器、保举器、搜刮器和排序器。 搜刮打算器(Search Planer) 是在线处事器的进口。它认真吸取来自查询天生器的查询哀求,并将哀求发送到其他在线组件并吸取返回功效。作者行使 Spring Boot 框架来实现搜刮打算器。 保举器(Recommender) 按照从用户数据库中获取的用户信息,对查询项举办说明,并提供本性化保举。作者行使 Flask Web 框架和 Nginx 构建种别猜测保举器,并回收 TensorFlow 实此刻线保举。 搜刮器(Searcher) 陈设在三个差异的集群上。按点击率和购置率,产物可以按人气坎坷分为三类。差异风行度产物的索引存储在差异的集群中。对付每个种别,搜刮器都回收差异的陈计划策。高人气的集群包括更多的节点和备份,担保了搜刮服从。而受接待水平较低的集群陈设的节点和备份数目起码。作者行使 Elasticsearch 来成立和打点三个搜刮集群。 排序器(Ranker) 行使保举器返回的权重作为初始权重,通过一个本性化的 L2R 神经收集对产物得分举办排序。排序器也行使 Elasticsearch 实现产物排序。 在线处事流程如下: (1)查询天生器模仿并发用户,向搜刮打算器发送查询哀求; (2)搜刮打算器吸取查询哀求并将查询项发送给保举者; (3)保举器对查询举办说明,并将种别猜测功效和本性化属性权重返回给搜刮打算器; (4)搜刮打算器向搜刮器发送初始查询项和猜测的分类功效; (5)搜刮器搜刮反向索引并将产物 ID 返回给搜刮打算器; (6)搜刮打算器向排序器发送产物 id 和本性化属性权重; (7)排序器按照初始权重对产物举办排序,并将排序得分返回给搜刮打算器; (8)搜刮打算器按照产物标识发送产物数据库会见哀求,获取产物信息; (9)搜刮打算器将搜刮到的产物信息返回给查询天生器。 3.1.2 离线说明器 离线说明器认真实习模子和成立索引,以进步在线处事机能。它由人工智能实习器、功课调治措施和索引器三部门构成。 人工智能实习器(AI trainer) 操作数据库中存储的相干数据实习模子。 功课调治措施(Job scheduler) 提供了两种实习机制:批处理赏罚和流式处理赏罚。在实际场景中,一些模子必要常常更新。譬喻,当我们搜刮一个项目并点击第一页中表现的一个产物时,应用措施将当即基于我们方才单击的产物实习新模子,并在第二页中表现新的保举。该基准实现思量了这种环境,并回收流式要领每隔几秒钟更新一次模子。对付批处理赏罚,实习器将每隔几个小时更新一次模子。 索引器(Indexer) 用于为产物信息构建索引。 3.2 其他行业应用措施的可扩展性 以医学人工智能场景为例,作者先容了怎样操作 AIBench 框架构建临床诊断应用的端到端基准。人工智能相干的临床诊断要害路径包罗以下步调。 1)按照病史数据离线实习一系列诊断模子,如检测模子、分类模子、保举模子等; 2)检测患者体检数据中的非常信息,如 CT 图像的肿瘤检测; 3)分类猜测隐藏疾病; 4)保举得当的治疗方案。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |