六小我私人怎样运维一万台处事器?
副问题[/!--empirenews.page--]
注:本日给各人分享的主题是“去哪儿网应用运维自动化演进之路”。自动化构建进程中所碰着的障碍以及我们是怎么样超过这些障碍,我们碰着了哪些坑,以及怎么填平这些坑的进程。 我 2013 年插手去哪儿网,一向在从事运维开拓事变。去哪儿网运维开拓有一个特点,全部开拓既当 PM,又当 QA,也没有区分前端事变照旧后端事变,用此刻较量风行的话说,我们都是全栈工程师。 插手去哪儿这几年,我做的事变也是较量琐屑的,那边有需求就去那边。 归纳综合起来首要涉及主机打点、应用打点、监控、报警平台等计划,开拓和运维这几方面的事变。 下面简朴先容一下我们的运维团队:
—————————— 去哪儿网应用运维平台先容 —————————— 起首简朴先容一下去哪儿网应用运维平台。 我们知道一个应用从开拓到线上运行,它的生命周期首要涉及到四个部门:
去哪儿网的营业也是一步步成长起来的,呆板从几十台到上万台,在成长的进程中我们碰着了许多题目,在差异的阶段我们也提出了差异的办理方案。 去哪儿网经验的阶段分为四个部门: 1、运维呆板数目较量少,大部门的事变都是应急运维。好比我们发明一个应用有题目了,我们登录到这个应用的相干呆板上,手动执行 Linux 呼吁,去查察这个呆板的资源行使环境。 好比 CPU 是不是太高了,是不是磁盘占满了,这个阶段也没有效到太伟大的剧本,根基上都是手动操纵,几十台阁下。 2、跟着局限扩大,手动写了许多剧本,有了这些剧本之后我们就可以批量去执利用命,可以在多台呆板上批量陈设应用和监控。 这个阶段,我们称为剧本运维的阶段,即操作剧本而且团结开源的体系,完成对数百台呆板的运维。 3、跟着局限越来越大,剧本运维不足用了,远远不能满意需求。剧本也许都是分类的剧本,并没有颠末公道的编排,这样剧本的执行次序就较量重要,没有公道编排也许会导致一些题目。 我们开拓一些相干的体系,用体系把相干的剧本串联起来,编排好构成一个一个疏散的操纵。好比说一台呆板的新建和删除就是单独的操纵,把这些做成体系,运维职员可以在界面上操纵。 这个阶段,我们称之为分立体系,数据根基上在各个体系之间没有实现一个较量好的共享。这个阶段能运维的主机数目也较量有限,数千台的主机是较量好的。 4、紧接着去哪儿网的呆板局限打破了万台以上,这时辰我们思量能不能从一个较量高的角度去公道计一律下运维平台。 为我们的运维事变提供一站式的处事,在一站式处事的基本上我们实现数据互通,这样就可以交互起来,做一些自动化的事变。这个时期也是本日我们首要要讲的内容,即运维平台的建树。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |