SQL on Hadoop在快手大数据平台的实践与优化
在HS2的ThriftServer层我们增进了接口,与运维体系买通后,设置下推更新的时辰自动挪用,可实现设置的热加载见效。 HiveServer2的Scratchdir优化 HiveServer2的scratchdir首要用于运行进程中的姑且文件存储。当HS2中的会话建设时,便会建设scratchdir。 在HDFS压力大的时辰,大量的会话会阻塞在建设scratchdir进程,导致毗连数会萃至上限,最终HS2处事无法再连入新毗连,影响处事可用性。 对此,我们先疏散了一样平常查询与create temporay table查询的scratch目次,并支持create temporay table查询的scratch的懒建设。 当create temporay table大量建设姑且文件,便会影响HDFS NameNode耽误时刻的时辰,一样平常查询的scratchdir HDFS NameNode可以正常相应。 另外,HS2还支持设置多scratch,差异的scratch能配置加载比率,从而实现HDFS的平衡负载。 Hive Stage并发调治非常修复 Hive调治个中存在两个题目。 一、子Task非执行状态为完成环境的时辰,如有多轮父Task包括子Task,导致子Task被一再插手调治行列。这种Case,必要将非执行状态修改成初始化状态。 二、当判定子Task是否可执行的进程中,会由于状态检测非常,无法正常插手必要调治的子Task,从而致使查询丢失Stage。而这种Case,我们的做法是在执行完成后,插手一轮Stage的执行功效状态搜查,一旦发明有下流Stage没有完成,直接抛堕落误,实现查询功效状态的完整性搜查。 其余改造
SQL on Hadoop平台在行使中碰着的痛点 为什么要开拓SQL专家体系
SQL专家体系 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |