服务器数据全没了!一次RAID5崩溃引发的思考...
9月15日技能沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖切磋精准运维!
变乱产生在Linus事变室燕徙之际,主力军Whonnock处事器半途崩掉,自动下线关机,宕机导致电脑全卡,分开了处事器,啥也干不了啊! 奈何快速规复?重组RAID很轻易粉碎原数据。Linus团队实行把文件所有转移到其unRAID Vault备份处事器,等候体系能从头上线。 此时Linus却发明 这台处事器由三组RAID5组成,24块SSD在Windows内所有并成一块,假如恣意一组RAID5彻底破坏,所稀有据就会丢失,经搜查,其时仅有不到10%的数据备份完成。 重建处事器?这可不是件易事,有也许会变得更糟。为了诊断出缘故起因,这位小哥起首把处事器转移到另一台机箱,换一套新的SATA背板再接上更强的电源就可以了吧?... 小哥乃至换用另一张LSI RAID节制卡,试图导入阵列,固然这玩意儿检测到了磁盘,形成了阵列,但就是无法正常导入,险些前14个小时都花在了接洽专业数据规复处事上!! 处事商也只能通过SSH呼吁长途将文件包导回妨碍处事器,辅佐规复那组挂掉的RAID5。下载长途规复平台后,试着重启磁盘,接上UPS(不中断电源)后,小哥心想,要是能有个能接入24个磁盘的主板或HBA集成卡来规复数据就更好了,他筹备在每个RAID5重建时,8个一组依次接入主板,但RAID5偏偏死活不让其他软件直接会见磁盘原数据,把磁盘全拔出来直接连主板,按理说该从头启动了,固然磁盘在BIOS里能被检测到,但坚苦重重,PCIE端口错误,SATA口所有未检测到 … 假如失去恣意一组RAID5中的3块磁盘挂掉 意味着全部RAID数据再也找不回了 word天,真的要吃土? 此时,辖档同续处于无法启动状态 其实让人恼火 小哥暗示本身有坐过山车的赶脚了,要知道Whonnock处事器里存着许多正在建造的视频项目,还没来及备份就… 个中一段视频,光租装备录制就花了一千多刀,处理赏罚视频的模板、台词模板、用户协议等一大堆重要文件都在这台处事器上,异地备份处事器还没装好,假如这些数据没了,蓝瘦香菇… 网友不禁叹息:小哥够斗胆,在处事器顶用SSD重组RAID,SSD一旦挂掉,数据是完全不行能规复的!用机器盘组RAID会更安详。 这20分钟的视频让观众的心跟着小哥跌荡升沉,亏得颠末从头挂载文件,原数据规复正常!
固然处事器最终规复正常,但团队始终冒着极高风险,并为此支付了时刻和精神,营业服从受到了重大影响。这还只是个小型处事器,若在上市企业或当局平台的大局限数据中心中呈现此类题目,效果不堪假想,任何一丁点儿过错带来的直接经济丧失不行估计!! 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |