加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

【IDCC2020】广东浩云长盛网络股份有限公司全国运维总经理朱红兵:数据中心全生命周期运营管理

发布时间:2020-12-12 11:58:49 所属栏目:运营 来源:网络整理
导读:2020年12月8日-10日,第十五届中国IDC财富年度大典在北京国度集会会议中心正式召开。作为数据中心云计较财富内知名的盛会以及IDC企业、电信运营商、互联网、金融、当局和厂商等财富上下流的高效雷同平台,与会高朋包罗当局率领,行业专家和企业代表数千人。以
副问题[/!--empirenews.page--]

2020年12月8日-10日,第十五届中国IDC财富年度大典在北京国度集会会议中心正式召开。作为数据中心云计较财富内知名的盛会以及IDC企业、电信运营­­商、互联网、金融、当局和厂商等财富上下流的高效雷同平台,与会高朋包罗当局率领,行业专家和企业代表数千人。以“数据中心新技能与应用”为主题的分论坛于10日进行,广东浩云长盛收集股份有限公司世界运维总司理朱红兵颁发了《数据中心全生命周期运营打点》主题演讲。

朱红兵

尊敬的列位率领,专家,各人上午好,我是朱红兵,来自浩云长盛收集股份有限公司,我从事数据中心运营打点有十几年,先后在电信运营商、互联网公司和第三方的运营商认真运营打点事变。本日以我本身的履历和心得分享一下数据中心运营的心得和履历。

第一部门,数据中心的运营特点和痛点,大部门时刻聚焦在数据中心的办理之道,最后会有一个小的回首和瞻望。

起首看一下数据中心的运营责任,作为数据中心的运营方必定有许多KPI和压力,包罗本钱打点、职员作育、团队打点、SLA的告竣。可是数据中心的最重要责任就是数据中心的靠得住性可能可用性,由于数据中心的运营事变是为数据中心功效认真的脚色。我是把数据中心的靠得住性界说为永欠妥协的指标,是作为我们的主要责任。

我们再看一下数据中心运营的痛点,第一个痛点就是宕机的风险,事情的种类或许有三大类,第一类是装备类的,包罗UPS、发电机、空调,由于我们的装备跟生物体一样也有生命周期,装备自己也有磨合期、稳按期、阑珊期,装备自然的机能落伍这是一个大的缘故起因。第二个缘故起因是工钱的缘故起因,第三个是天然灾难情形的缘故起因。装备的妨碍通过有用的提防性维护本领举办低落。工钱妨碍可能天然灾难凡是没步伐彻底消除,以是我们数据中心的妨碍可能宕机的风险在某种环境下时可控的,可是没步伐消除。宕机的本钱又是每每很是高,我们看一下北美的数据,单次宕机造成的本钱靠近100万美元。虽然这个数据我们可以拿过来参考,作为我们第三方数据中心运营商来讲,两类公司,第一类已经上市的数据中心运营商,这样的宕机事情对公司的股价会带来颠簸,对付我们这样新兴的数据中心运营商会大幅影响融资和公司的估值,这个是最大的痛点。

数据中心运营的第二个痛点就是运营的伟大性,第一个方面由于我们必要遵行可能依照的尺度要求、类型出格多,包罗我们有国标、UPITIME的类型。第二大类缘故起因是可以看现场的运维打点事变,除了现场的巡检、装备维护,做妨碍处理赏罚和隐患消除,做这些事变的时辰还要担保SLA的刚性告竣,还必要担保时效和体系可用性。第三个首要在于三个麋集型,数据中心运营事变麋集型:

第一,职员麋集型,这个较量轻易领略,举个例子,一个具有20小我私人的计划团队作为第三方数据中心运营商,它在海内应该是TOP10了。一个具有20个计划团队的第三方运营公司在海内也许靠近TOP10了,可是一个具有20小我私人运营团队的公司只是方才起步,通例的中等数据中心职员必要20人,职员很是伟大。我之前地址的一家公司是海内的上市公司,整个公司靠近500人,运维团队我认真的打点职员靠近400人,高出了它70%的职员,这么多职员的打点难度长短常大的。

第二个,成本麋集型。由于数据中心是重资产行业,我们2000个机架的数据中心,或许基本办法投资2个亿阁下,假如含上处事器的资产和收集传输装备的资产,这样的数据中心内里的资产局限高出10个亿,靠近15亿。这么珍贵的资产在一栋楼内里带来的基本办法运维的,信息安详的,审计的苛刻要求。

第三计划麋集型,数据中心首要涉及电器、暖通、消防、路电,但还包罗计较机、收集、传输,必要许多复合型的专业理论支撑。这么多的要求导致专业性要求很是高。我们综合来看三个方面大的缘故起因导致了运营的伟大性长短常高的。这是运营的第二个痛点。

针对数据中心运营的痛点可能特点,我们该怎么做?浩云长盛收集股份有限公司团结本身的履历和心得,我们有四个方面的办理之道。

数据中心的运维体厦魅整体的接管度很是高,由于此刻都或多或少慢慢成立和完美本身的运维系统,可是轻易出题目的是轻易缺头,缺前面的这部门。缺尾是后头那部门。很大都据中心在中间的运营进程傍边它的SOP、EOP、应急预案、应急演练都较量完美。可是有没有参加前期的数据中心选址,有没有前期阶段把本身的要求融入到计划筹划内里去?在工程制作的时辰有没有磨练?有没有跟进工程质量?在验证测试进程中有没有主导验证测试?第二个轻易缺的尾巴,由于我们数据中心正常的生命周期或许是8到10年,可是我装备的生命周期没有这么长,像蓄电池正常的生命周期就是6年阁下,包罗寒气塔、慎密空调、风柜,它的周期5到8年的时辰必要大修,必要优化、改革,这部门的运维系统许多第三方偕行是轻易缺的。

第二个轻易缺的处所是许多偕行做这个工作的时辰,它的运维系统有,可是许多年没有迭代。我们常常跟友商交换,看它的运维体厦魅整体的很是好,放在文件夹内里,一翻2017年建造的,到此刻三年了没有任何变革,可是三年的时刻周期,数据中心的职员已经产生很大变革,数据中心的装备负载率产生很大变革,数据中心的装备机能也产生很大变革,可是它的运维系统一向没有优化迭代,照旧那样的状况,没有与时俱进,这样就导致许多题目。我们有一个华南的数据中心在本年疫情进程傍边,1月23号广东省已经产生了应急预案,可是这个公司到3月份也没有做预案,当局把这个数据中心全部的职员逼迫断绝了,他们没步伐找了省内休假还可以回到广东的员工,加上托管的职员,险些便是裸奔。1月份已经宣布了严酷的民众卫生预案相应,企业没有迭代本身的系统,还凭证原本的方法运行就轻易呈现题目。

对付我们新兴的业主单元,可能方才进入这个规模不久的第三方运营商,小我私人提议可以参照一下MO的运维打点系统,优化和迭代企业的运维尺度。

泰尔把数据中心的认证分为T1到T4,尺度焦点要素有两个,第一个它的拓扑布局,第二个是做它的运维打点手段。拓扑布局是此刻主流的数据中心已经接管度很是高了,根基都是凭证机房可能T3+的尺度建树,这一部门在拓扑布局海内的差别不是出格大,根基都能满意这样的要求。影响一个数据中心的可用性,它的永续手段首要看它的运营打点手段,运营打点手段很弱,你的数据中心也未必到达T3+的尺度。

简朴小结一下:一个优越的运维系统,一个优越的运维打点系统,它必然有两个特性,第一个包围全生命周期,第二个它的运维系统必然是不绝地优化、迭代,不绝地完美的系统。

这是我们全生命周期运营办理之道的第一点。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读