Apache Flink 漫谈系列 - 流表对偶(duality)性
发布时间:2018-11-01 23:06:26 所属栏目:教程 来源:孙金城
导读:现实题目 许多大数据计较产物,都对用户提供了SQL API,好比Hive, Spark, Flink等,那么SQL作为传统相关数据库的查询说话,是应用在批查询场景的。Hive和Spark本质上都是Batch的计较模式(在《Apache Flink 漫谈系列 - 概述》我们先容过Spark是Micro Batchi
前面我耗费了一些时刻先容了MySQL主备复制机制和binlog的数据名目,binlog中携带时刻戳,我们将全部表的操纵都定时刻举办记录下来形成binlog,而对binlog的event举办重放的进程就是流数据处理赏罚的进程,重放的功效恰好又形成了一张表。也就是表的操纵会形成携带时刻的变乱流,对流的处理赏罚又会形成一张不绝变革的表,表和流具有等价性,可以互转。跟着时刻推移,DML操纵不绝举办,那么表的内容也不绝变革,详细如下: 如上图所示内容,流和表具备沟通的特性:
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |