加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

对比Flink与Storm性能,分布式实时计算框架该这样选

发布时间:2019-06-27 23:30:49 所属栏目:建站 来源:梦瑶
导读:一、配景 Apache Flink 和 Apache Storm 是当前业界普及行使的两个漫衍式及时计较框架。个中 Apache Storm(以下简称Storm)在美团点评及时计较营业中已有较为成熟的运用,有打点平台、常用 API 和响应的文档,大量及时功课基于 Storm 构建。 Apache Storm参

Metrics Collector 按 outTime 取五分钟的转动时刻窗口,计较五分钟的均匀吞吐(输出数据的条数)、五分钟内的耽误(outTime - eventTime 或 outTime - inTime)的中位数及 99 线等指标,写入 MySQL 响应的数据表中。最后对 MySQL 表中的吞吐计较均值,耽误中位数及耽误 99 线选取中位数,绘制图像并说明。

2、默认参数

Storm 和 Flink 默认均为 At Least Once语义。

Storm 开启 ACK,ACKer 数目为 1。

Flink 的 Checkpoint 时距离断为 30 秒,默认 StateBackend 为 Memory。

担保 Kafka 不是机能瓶颈,尽也许解除 Kafka 对测试功效的影响。

测试耽误时数据出产速度小于数据处理赏罚手段,假设数据被写入 Kafka 后立即被读取,即 eventTime 便是数据进入体系的时刻。

测试吞吐量时从 Kafka Topic 的最旧开始读取,假设该 Topic 中的测试数据量富裕。

3、测试用例

1)Identity

Identity 用例首要模仿“输入-输出”简朴处理赏罚场景,反应两个框架自己的机能。

输入数据为“msgId, eventTime”,个中 eventTime 视为数据天生时刻。单条输入数据约 20 B。

进入功课处理赏罚流程时记录 inTime,功课处理赏罚完成后(筹备输出时)记录 outTime。

功课从 Kafka Topic Data 中读取数据后,在字符串末端追加时刻戳,然后直接输出到 Kafka。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读