加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程 > 正文

数据库智能运维试探与实践

发布时间:2018-12-14 13:38:48 所属栏目:编程 来源:应钢
导读:从自动化到智能化运维过渡时,美团DBA团队举办了哪些思索、试探与实践?本文按照赵应钢在第九届中国数据库技能大会上的演讲内容清算而成,部门内容有更新。 配景 近些年,传统的数据库运维方法已经越来越难于满意营业方对数据库的不变性、可用性、机动性的
副问题[/!--empirenews.page--]

从自动化到智能化运维过渡时,美团DBA团队举办了哪些思索、试探与实践?本文按照赵应钢在“第九届中国数据库技能大会”上的演讲内容清算而成,部门内容有更新。

配景

近些年,传统的数据库运维方法已经越来越难于满意营业方对数据库的不变性、可用性、机动性的要求。跟着数据库局限急速扩大,各类NewSQL体系上线行使,运维逐渐跟不上营业成长,各类抵牾袒露的越发明明。在营业的驱动下,美团点评DBA团队经验了从“人肉”运维到器材化、产物化、自助化、自动化的转型之旅,也开始了智能运维在数据库规模的思索和实践。

数据库智能运维试探与实践

本文将先容美团点评整个数据库平台的演进汗青,以及我们当前的环境和面对的一些挑衅,最后分享一下我们从自动化到智能化运维过渡时,所举办的思索、试探与实践。

数据库平台的演变

我们数据库平台的演进或许经验了五个大的阶段:

数据库智能运维试探与实践

第一个是剧本化阶段,这个阶段,我们人少,集群少,处事流量也较量小,剧本化的模式足以支撑整个处事。

第二个是器材化阶段,我们把一些剧本包装成器材,环绕CMDB打点资产和处事,并完美了监控体系。这时,我们的器材箱也逐渐富厚起来,包罗DDL改观器材、SQL Review器材、慢查询收罗说明器材和备份闪回器材等等。

第三个是产物化阶段,器材化阶段也许照旧单个的器材,可是在完成一些伟大操纵时,就必要把这些器材组装起来形成一个产物。虽然,并不是嗣魅这个产物必然要做成Web体系的情势,而是器材组装起来形成一套流程之后,就可以担保全部DBA的操纵举动,对流程的领略以及对线上的影响都是同等的。我们会在易用性和安详性层面不绝举办打磨。而器材产物化的首要受益者是DBA,其定位是晋升运维处事的服从,镌汰事情的产生,并利便举办快速同一的迭代。

第四个是打造私有云平台阶段,跟着美团点评营业的高速成长,仅靠十几、二十个DBA越来越难以满意营业成长的必要。以是我们就把某些一般操纵开放授权,闪开拓职员自助去做,将DBA从繁琐的操纵中解放出来。其时整个平台天天执行300多次改表操纵;自助查询高出1万次;自助申请账号、授权并调解监控;自助界说敏感数据并授权给营业方打点员自助审批和打点;自界说营业的岑岭和低峰时刻段等等;自助下载、查询日记等等。

第五个是自动化阶段,对这个阶段的领略,着实是“仁者见仁,智者见智”。大大都人领略的自动化,只是通过Web平台来执行某些操纵,但我们以为这只是半自动化,所谓的自动化应该是完全不必要人参加。今朝,我们许多操纵都还处于半自动化阶段,下一个阶段我们必要从半自动过渡到全自动。以MySQL体系为例,从运维角度看包罗主从的高可用、处事过载的自我掩护、容量自动诊断与评估以及集群的自动扩缩容等等。

近况和面对的挑衅

下图是我们平台的近况,以相关数据库RDS平台为例,个中集成了许多打点的成果,譬喻主从的高可用、MGW的打点、DNS的改观、备份体系、进级流程、流量分派和切换体系、账号打点、数据归档、处事与资产的流转体系等等。

数据库智能运维试探与实践

并且我们凭证逻辑对平台计划举办了分别,譬喻以用户维度分另外RDS自助平台,DBA打点平台和测试情形打点平台;以成果维度分另外运维、运营和监控;以存储范例为维度分另外相关型数据库MySQL、漫衍式KV缓存、漫衍式KV存储,以及正在建树中的NewSQL数据库平台等等。将来,我们但愿打造成“MySQL+NoSQL+NewSQL,存储+缓存的一站式处事平台”。

挑衅一:RootCause定位难

即便我们打造了一个很强盛的平台,但照旧发明有许多题目难以搞定。第一个就是妨碍定位,假如是简朴的妨碍,我们有相同天网、雷达这样的体系去发明和定位。可是假如妨碍产生在数据库内部,那就必要专业的数据库常识,去定位和查明到底是什么缘故起因导致了妨碍。

数据库智能运维试探与实践

凡是来讲,妨碍的轨迹是一个链,但也也许是一个“多米诺骨牌”的连环。也许由于一些缘故起因导致SQL执行变慢,引起毗连数的增添,进而导致营业超时,而营业超时又会激发营业不绝重试,功效会发生更多的题目。当我们收到一个报警时,也许已颠末尾30秒乃至更长时刻,DBA再去查察时,已经错过了最佳的事情处理赏罚机缘。以是,我们要在妨碍产生之后,拟定一些应对计策,譬喻快速切换主库、自动屏障下线题目从库等等。除此之外,尚有一个较量难的题目,就是怎样停止相似的妨碍再次呈现。

挑衅二:人力和成长逆境

第二个挑衅是人力和成长的逆境,当处事流量成倍增添时,其本钱并不是以沟通的速率对应增添的。当营业逻辑越来越伟大时,每增进一块钱的营收,厥后头对应的数据库QPS也许是2倍乃至5倍,营业逻辑越伟大,处事支撑的难度越大。其它,传统的相关型数据库在容量、延时、相应时刻以及数据量等方面很轻易到达瓶颈,这就必要我们不绝拆分集群,同时开拓诉求也多种多样,当我们实行行使平台化的头脑去办理题目时,还要充实思索怎样满意研发职员多样化的需求。

数据库智能运维试探与实践

人力逆境这一题目,从DBA的角度来说,时刻被严峻的碎片化,自身的生长就会碰着瓶颈,好比常常会做一些死板的一再操纵;其它,营业咨询量暴增,尽量我们已经在实行平台化的要领,可是照旧跟不上营业成长的速率。尚有一个就是专业的DBA越来越匮乏,越来越贵,要害是基础雇用不到人手。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读