Apache Flink 漫谈系列 - 流表对偶(duality)性

发布时间：2018-11-01 23:06:26 所属栏目：教程来源：孙金城

导读：现实题目许多大数据计较产物，都对用户提供了SQL API，好比Hive, Spark, Flink等，那么SQL作为传统相关数据库的查询说话，是应用在批查询场景的。Hive和Spark本质上都是Batch的计较模式(在《Apache Flink 漫谈系列 - 概述》我们先容过Spark是Micro Batchi

前面我耗费了一些时刻先容了MySQL主备复制机制和binlog的数据名目，binlog中携带时刻戳，我们将全部表的操纵都定时刻举办记录下来形成binlog，而对binlog的event举办重放的进程就是流数据处理赏罚的进程，重放的功效恰好又形成了一张表。也就是表的操纵会形成携带时刻的变乱流，对流的处理赏罚又会形成一张不绝变革的表，表和流具有等价性，可以互转。跟着时刻推移，DML操纵不绝举办，那么表的内容也不绝变革，详细如下：

如上图所示内容，流和表具备沟通的特性：

表 - Schema，Data，DML操纵时刻
流 - Schema，Data, Data处理赏罚时刻

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

11/19

首页

尾页

教你如何安装ghost xp	深度技术Ghost xp系统
ghost xp sp3电脑公司	8187无线网卡驱动,教您