六个人如何运维一万台服务器?
数据互通。 主机打点去哪儿网的主机打点体系是以 OpenStack 和 DNSDB 为焦点的, OpenStack 认真调治建设假造机, DNSDB 是域名打点体系。 通过 DNSDB 我们可以将一个呆板的名称、部分、用途和它地址的机房构成一个独一的域名,我们用这个独一的域名来标识这台主机。 在 OpenStack 、 DNSDB 之上,我们写了大量的剧本文档和器材,将这些剧本文档和器材编排起来,封装成一个一个的操纵,而且我们给这些操纵赋予一些相干的权限。 我们把主机的信息、畅通的打点、权限的设置尚有操纵日记的查询城市存在日记库里。最后我们会把一个主机打点体系的界面袒露给运维职员,运维职员通过这个界面来打点我们的主机。 有了主机打点平台之后,运维职员就可以很是利便的在这个平台上建设、烧毁主机,查察主机的相干信息,好比说它的设置、过保信息等等。 我们在腥蚊?台呆板的进程中城市默认给这个呆板加上监控报警,呆板有报警的时辰也会关照到相干的认真人。 这样做照旧会存在一个较量大的题目,即我们这个体系是怎么开拓给运维职员行使的,开拓职员并没有权限登录这个体系。 若是说开拓职员提出来一个需求,我要建设一台主机,就必要给 OPS 发邮件,OPS 建设这台主机的时辰,着实并没有很是精确的记录到这个认真人是谁,他也许会写在备注里,这个备注跟着时刻的推移,有也许禁绝了。 由于其时的认真人也许去职了可能转岗,这种环境都是常常产生的。 这个呆板所认真的部分也没有去很好的记录,由于这个部分许多只是表此刻主机这个名称上,可是有也许这台呆板在行使的进程中也许会转给其他营业线的部分行使,这样我们拿到的部分信息也是禁绝确的。 尚有一个题目 DB 体系只对运维职员开放,营业线参加很少,导致整个主机的相干信息着实是不足精确的,由于 OPS 职员事实有限,不行能很是精确的维护这些信息。 这样我们就想到一个方案,通过应用树去办理。 去哪儿网把营业线凭证成果区分别到各个 BU,应用树 BU 作为第一级,下面有部分,部分下面尚有更小的部分,这个层级也许是多个的。 最后一级是部分下面所认真的应用,应用是作为最后一级的。我们把全部的级别都作为一个节点,在每个节点上都可以绑定主机,给节点添加认真人,给节点添加审批人,下面我会先容审批人的权限和脚色。 有了这个应用树之后,营业线开拓参加进来,参加打点主机,他们的认真人和部分信息越发精确。 一台呆板呈现非常,我想很是敏捷找到这个呆板的认真人也很是轻易。 若是说宿主机顿时要过保了,它上面的全部的虚机我都必要找到这个虚机的认真人,关照这些人去执行相干的操纵,好比像虚机下线、应用下线,这样可以停止许多运维宿主机过保而导致的妨碍。 由于呆板的认真人较量准确了,我们的报警关照会默认把呆板的监控报警都关照给相干的认真人,由认真人来处理赏罚呆板相干的基本硬件报警。 每个季度城市统计资源的耗损,也会对下个季度呆板的采购做筹划和预算。 拿到较量上级的部分,好比拿到一个 BU 节点,可以通过应用树很轻易拿到这个部分下都有哪些呆板,他这个月的增添量是几多,我们就可以很利便的猜测下个季度我们必要采购几多量的呆板,从而拟定越发公道的预算。 有了用户之后,认真人、部分和呆板的相关都是较量明晰的。 可是存在一个题目,申请资源的时辰,如故必要由 OPS 举办操纵,账号添加也是由 OPS 认真,一个开拓职员想要扩容一台呆板可能给一个呆板去添加账号,要怎么做? (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |