加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一篇运维老司机的大数据平台监控宝典(2)-联通大数据集群平台监控体系详解

发布时间:2019-05-16 04:06:19 所属栏目:教程 来源:中国联通大数据
导读:在上一篇文章【一篇运维老司机的大数据平台监控宝典(1)】中,我们先容了今朝联通大数据监控平台由Grafana+Influxdb+Prometheus+Alertmanager等组件构成,而且着重详述了以Grafana为焦点的图形化展示成果。 本文继承针对运维监控系统的另一重要内容,即告警

Fabric成立毗连执行规复呼吁。

一篇运维老司机的大数据平台监控宝典(2)-联通大数据集群平台监控系统详解

今朝自动化规复涉及的集群一般运维操纵有:

  • 计较节点检测出行使swap互换分区,将会自动整理swap分区,并封锁swap分区。
  • 计较节点检测出时钟毛病,将会自动纠偏时钟毛病。
  • cloudera manager署理挂掉,将会自动重启。
  • 主机检测出有坏盘,坏盘改换完成后,自动规复。
  • 脚色实例检测出非常掉线,自动规复上线。
  • 集群存在多个节点多块磁盘存储剩余空间不敷,自动举办磁盘级此外数据balancer。
  • 集群存储到达阈值,自动举办节点级此外数据balancer。

必要提醒的是,自动化规复的合用场景许多,但并不合用于有数妨碍且该妨碍有必然概率会影响到平台部门成果机能的环境,提议各人行使前严谨衡量、有的放矢。

【本文是51CTO专栏机构中国联通大数据的原创文章,微信公家号“中国联通大数据( id: unibigdata)”】

戳这里,看该作者更多好文

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读