这里有很全的监控组件,你得当哪一款?
OpenTracing大有一统全国的架势,它在个中融合Tracing、Log、Metrics的观念。我们照旧看张图吧,等真正去做的时辰去相识也不晚(来历于收集): 值得一提的是,SpringCloud对它的支持照旧较量全面的(OpenTracing API Contributions),但依靠相关和版本搞的很是紊乱。提议参考后本身开拓,概略行使”spring boot starter”技能,可以很轻易的写上一版。 至于”Spring Cloud 2”,更近一步,集成了micrometer这种神器,对prometheus集成也长短常的有好。营业metrics监控将省下不少实力。 以上谈了这么多,仅仅是聊了一下网络方面罢了。尺度这个思绪长短常对的,不然每个公司都要写一遍海量的网络组件,多死板。至于海内大公司的产物,是否会主动向其靠拢,我们拭目以待。 处事端方面,我们以Uber的Jaeger为例,声名一下处事端必要的概略组件:
是的,典范的无状态体系,对等节点当机无影响。 4、说明和预警 上面的状态图不止一次提到流计较,这也不消非要整个Spark Streaming,从kafka吸取一份数据本身处理赏罚也叫流计较,选用最新的kafka stream也是不从的选择。重要的是聚合聚合聚合,重要的工作说三遍。 一样平常,算一些QPS,RT等,也就是纯粹的计数;可能斜率,也就是增添降落速率;伟大点的有TP值(有百分之几多的哀求在XX秒内响应),尚有挪用链的处事拓扑图、日记非常的统计,都可以在这里举办计较。 荣幸的是,流计较的API都较量简朴,就是调试较量费劲。 说明后的数据属于加工数据,是要分隔存储的,虽然量小的话,也可以和原始数据混在一路。 说明后的数据量是可评估的,好比5秒一条数据,一天就牢靠的17280条,预警模块读的是说明后的数据(原始数据太大了),也会涉及大量的计较。 那么说明后的统计数据用来干什么用呢?一部门就是预警;另一部门就是展示。 1)预警 拿我计划的一个原型来看,对一个metric的操纵概略有以下内容:
仅做参考,这只是设置的冰山一角。要把各类出动员作做一遍,你是要挥霍许多脑细胞的。 2)展示 有许多可视化js库,但事变量一样平常都很大。但没步伐,简朴的用grafana设置一下就可以了,伟大点的还必要亲身操刀。 我这里有两张简朴的grafana图,可以参考一下: [体系监控] [jvm监控一部门] 5、小结 整体来说,整个别系就是网络、处理赏罚、应用这大三类数据(logs、metrics、trace)。 个中有些组件的履历可以共用,但网络部门和应用部门相差很大。我实行总结了一张图,但从中只能看到有哪些组件参加,只看图是摹仿两可的。 详细的数据流转和处理赏罚,每种布局都不尽沟通,这也是为什么我一向夸大分而治之的缘故起因。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |