SQL on Hadoop在快手大数据平台的实践与优化
为了担保焦点使命的不变性,将ETL集群举办了分级,分为焦点集群和一样平常集群。在客户端毗连HS2的时辰,我们会对使命优先级鉴定,高优先级的使命会被路由到焦点集群,低优先级的使命会被路由到一样平常集群。 HiveServer2处事内部流程图 BeaconServer处事 BeaconServer处事为后端Hook Server处事,共同HS2中的Hook,在HS2处事之外实现了所需的成果。当前支持的模块包罗路由、审计、SQL重写、使命节制、错误说明、优化提议等。 • 无状态,BeaconServer处事支持程度扩展。基于哀求量的巨细,可弹性调解处事的局限。 • 设置动态加载,BeaconServer处事支持动态设置加载。各个模块支持开关,处事可动态加载设置实现上下线。好比路由模块,可按照后端加快引擎集群资源环境 ,举办路由比率调解乃至熔断。 • 无缝进级,BeaconServer处事的后端模块可单独举办下线进级操纵,不会影响Hook端HS2处事。 SQL on Hadoop平台在行使中碰着的痛点 行使新引擎举办加快面对的题目
智能引擎的办理方案
智能引擎:主流引擎方案比拟 智能引擎:HiveServer2自界说执行引擎的模块计划 基于HiveServer2,有两种实现方法。JDBC方法是通过JDBC接口,将SQL发送至后端加快引擎启动的集群上。PROXY方法是将SQL下推给当地的加快引擎启动的Client。 JDBC方法启动的后端集群,均是基于YARN,可以实现资源的分时复用。好比AdHoc集群的资源在夜间会自动接纳,作为报表体系的资源举办复用。 智能引擎:SQL路由方案计划架构 路由方案基于HS2的Hook架构,在HS2端实现对应 Hook,用于引擎切换;后端BeaconServer处事中实现路由 处事,用于SQL的路由法则的匹配处理赏罚。差异集群可设置差异的路由法则。 为了担保后算路由处事的不变性,团队还计划了Rewrite Hook,用于重写AdHoc集群中的SQL,自动添加LIMIT上限,防备大数据量的SCAN。 智能引擎:SQL路由法则一览 智能引擎:方案上风
智能引擎DQL应用结果 HiveServer2中存在的机能题目 FetchTask加快:预排序与逻辑优化 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |