加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

六小我私人怎样运维一万台处事器?

发布时间:2017-12-19 16:41:39 所属栏目:建站 来源:51CTO技术栈
导读:副问题#e# 注:本日给各人分享的主题是“去哪儿网应用运维自动化演进之路”。自动化构建进程中所碰着的障碍以及我们是怎么样超过这些障碍,我们碰着了哪些坑,以及怎么填平这些坑的进程。 我 2013 年插手去哪儿网,一向在从事运维开拓事变。去哪儿网运维开

有了本钱意识之后,我们可以越发公道的分派资源。好比有的应用自己不是很重要,还申请了出格多的呆板,呆板行使率也不高,拿到账单一看,这么一个不重要的应用竟然淹灭这么大的账单,然后他们就会接纳一部门资源。

今朝我们也在不绝的去接入各类百般的应用账单,好比说主机账单、收集带宽账单、监控报警、日记网络、大量的存储,尚有计较资源账单,尚有其他的一系列的账单,城市逐步接入进来。

——————————

总结

——————————

最后做一下总结,在去哪儿网运维自动化过程中,我们经验了差异的阶段。

我们发明等应用扩大到必然局限的时辰,必要运维平台化,自动的可能半自动的方法长短常淹灭人力资源的,而且它也会大抵发明一些错误乃至是妨碍。去哪儿网运维自动化也是做得很是不错的,怎么来浮现?

我 2013 年入职,我入职的时辰一般运维的职员或许有五六个,此刻我们一般运维的职员如故是六个,我们又推出了一个运维呆板人,运维第七人。

我们照旧保持在六人的状态,我们局限扩大了许多倍,从百台到万台,扩大了上百倍的局限,可是我们一般运维职员并没有增进,这是运维平台自动化带来的甜头。

应用的可用性必要监控报警体系的担保,根基上在一个应用上线之前就会去把它全部要害的报警和监控架好,这样应用有题目的话就会敏捷回滚可能去 debug 。

由于我们有完美的监控报警体系,以是去哪儿网的妨碍还算较量少的,均匀来说一天也就两三个妨碍。

可是去哪儿网的妨碍和其他的妨碍也许不太一样,去哪儿网的妨碍要求较量苛刻,一次收集妨碍我们就会记录批次的妨碍。

好比 Watcher 的监控体系不出图了,高出 5 分钟了,我们也许会穷究 P1 和 P2 的妨碍。

在这样的严酷要求下,我们的妨碍也不会太高,我入职四年来,此刻累计的妨碍数也就 3000 个阁下。

六小我私家奈何运维一万台办事器?

要担保我们整个运维生态的成长,我们必要将数据买通,买通必要给应用一个 ID,有了这个 ID 之后,我们就可以在各个运维体系僻静台上共享数据,形成一个良性的生态轮回。

作者:郑松宽,去哪儿网高级运维工程师。2013 年插手去哪儿网平台奇迹部,从事运维开拓事变。事变中首要认真公司监控体系的开拓,应用打点平台 Portal 的计划、开拓和运维。

来历:转载自高效运维微信公家号,本文清算自  GOPS2017 北京站演讲《去哪儿网应用运维自动化演进之路》,高效运维社区致力于随同您配合生长。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读