加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Apache Flink 漫谈系列 - 流表对偶(duality)性

发布时间:2018-11-01 23:06:26 所属栏目:教程 来源:孙金城
导读:现实题目 许多大数据计较产物,都对用户提供了SQL API,好比Hive, Spark, Flink等,那么SQL作为传统相关数据库的查询说话,是应用在批查询场景的。Hive和Spark本质上都是Batch的计较模式(在《Apache Flink 漫谈系列 - 概述》我们先容过Spark是Micro Batchi

前面我耗费了一些时刻先容了MySQL主备复制机制和binlog的数据名目,binlog中携带时刻戳,我们将全部表的操纵都定时刻举办记录下来形成binlog,而对binlog的event举办重放的进程就是流数据处理赏罚的进程,重放的功效恰好又形成了一张表。也就是表的操纵会形成携带时刻的变乱流,对流的处理赏罚又会形成一张不绝变革的表,表和流具有等价性,可以互转。跟着时刻推移,DML操纵不绝举办,那么表的内容也不绝变革,详细如下:

Apache Flink 漫谈系列 - 流表对偶(duality)性

如上图所示内容,流和表具备沟通的特性:

  • 表 - Schema,Data,DML操纵时刻
  • 流 - Schema,Data, Data处理赏罚时刻

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读