批量搜查和修复Windows假造机的要领
副问题[/!--empirenews.page--]
【新产物上线啦】51CTO播客,随时随地,碎片化进修
01 - 体系轮廓 我们内部有一个局限不大的私有云,承载内部应用和测试体系,今朝运行了高出1000台假造机。回收技能方案为KVM假造化+Sheepdog漫衍式块存储: (1)运行假造机的计较节点为CentOS 6.5,假造化技能回收KVM,假造机打点回收开源OpenNebula方案(选择OpenNebula首要是汗青沿用,一般打点需求简朴,根基够用) (2)假造机的镜像,运行在后端漫衍式块存储体系上,此体系是基于开源的Sheepdog架构。 02 - 存在的题目与办理思绪 2.1 - 存在题目 因为假造机镜像都承载在漫衍式块存储体系中,假造机的全部存储IO城市颠末漫衍式存储体系。在此环境下,一旦漫衍式块存储体系非常(如承载收集较大局限妨碍、存储体系集群机制非常等),承载假造机的计较节点与存储体系之间的存储IO呈现阻塞,进而假造机的存储IO也呈现阻塞,假造机操纵体系(出格是Windows操纵体系的假造机)会呈现非常,如Windows体系蓝屏、体系自检、进入搜查模式等各类环境。即便存储体系后续规复正常,这些假造机很也许依然处于非常状态。 假造机非常,一样平常有许多通例步伐来发明,如: (1) ping搜查。但假造机所属应用维护职员也许会榨取ping,或在安详组上做限定。 (2)陈设zabbix、nagios等监控体系的agent举办非常监控。但假造机所属应用维护职员也许会封锁或卸载agent。 (3)通过计较节点的qemu-kvm的一些器材来判定假造机文件体系是否可以写入。但这个方法涉及“侵入”假造机,属于严肃榨取的操纵。 可以看出上述要领有两个题目: (1)假如假造机归属差异行使人,每个行使人有差异运维气魄沤背同风俗或打点要求(如榨取ping或封锁agent客户端),行使通例要领来判定出题目的假造机遇有疏漏) (2)无法判定假造机(出格是Windows假造机)的详细非常环境,如蓝屏、体系自测等。 因此,最稳妥的方法是VNC器材毗连到各个假造机,搜查假造机屏幕信息判定其状态,再按照状态一个个修复(VNC固然可以看到假造机屏幕,可是假造机都是有登岸账号和登岸暗码的,搜查职员并没有这些账号暗码,因此不会“侵入”假造机)。可是修复进程很是繁琐,核查和修订的步调首要如下: 核查操纵: (1)登岸到某台计较节点,VNC某台假造机,通过VNC界面查察其状态(蓝屏、自检等)。假造机数目多的环境下,必要多人分工举办开展,通过表格举办记录。 (2)汇总各个搜查职员的搜查功效表格。 修复操纵: (3)凭证表格举办多人分工,各自认真部门假造机的修复,如下述4-6步调。 (4)实行人动重启假造机。 (5)假如仍旧蓝屏或其他非常,则必要手动挂载Win PE体系实行修复。必要手动将Win PE的iso文件拷贝至计较节点,手动修改假造机设置文件使其挂载Win PE的iso文件,重启假造机举办Win PE模式然后手动举办修复。 (6)修复完毕重启,假如体系仍旧无法登录,且假造机行使人提议重装操纵体系,则必要将假造机重置重装。 可以看出,整个进程都是手工对每台假造机别离操纵,耗时长,服从低。 2.2 - 办理思绪 上述手工操纵步调中,VNC设置、假造机汇总信息表格、假造机设置、Win PE iso镜像,都是文件情势,都可以通过剧本举办批量天生、修改,具备自动化的基本。 将上述手工操纵步调剧本化,形成如下批量核查和修复的剧本器材: (1)可以或许自动天生待核查的假造机信息excel表格 (2) 可以或许批量VNC截图假造机的屏幕状态,人工辨认和判定假造机屏幕的状态。 (3)对付必要修复,并能一键挂载Win PE镜像到假造机长举办引导修复或重装操纵。 03- 批量核查和修复假造机的详细要领 3.1 - 器材实现框架 在出产情形里,我们已经用了Saltstack作为设置器材,基于Saltstack的批量操纵与设置手段,我们在同一剧本处事器上,建造了对应的shell剧本和python脚原来实现详细成果,并用Linux的Diaglog举办简朴汇总展示。如下图: 3.2 - 一键导出假造机 按照集群影响范畴及假造机数目,凭证IP地点次序,导出全部也许存在题目的假造机到excel,导出来后可以举办过滤与编辑,快速举办多人分工核查。 在我们天生情形,统一网段对应的是统一个营业体系,因此我们一样平常按照假造机数目和营业体系(网段)举办分工。 3.3 - 假造机批量VNC截屏按键搜查 按照3.2步调过滤出的假造机IP地点信息,获取假造机地址物理机及VNC端标语,行使VNCdotool器材挪用假造机VNC接口举办按键测试,并举办假造机屏幕截图。 按照假造机IP地点信息,天生一个已经设定好模板的checklist表格(csv名目),便于记录和汇总后头步调中人工判定的信息。表格首要字段为: IP、主机名、假造机ID、营业辖档酮系人、第一次搜查功效,引导修复后状态,重装后状态。 将截图信息和表格一并打包下载到当地。 详细步调如下: (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |