加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Apache Flink 漫谈系列 - 流表对偶(duality)性

发布时间:2018-11-01 23:06:26 所属栏目:教程 来源:孙金城
导读:现实题目 许多大数据计较产物,都对用户提供了SQL API,好比Hive, Spark, Flink等,那么SQL作为传统相关数据库的查询说话,是应用在批查询场景的。Hive和Spark本质上都是Batch的计较模式(在《Apache Flink 漫谈系列 - 概述》我们先容过Spark是Micro Batchi

本篇首要先容Apache Flink作为一个流计较平台为什么可觉得用户提供SQL API。其基础缘故起因是假如将流上的数据看做是布局化的数据,流使命的焦点是将一个具偶然刻属性的布局化数据酿成同样具偶然刻属性的另一个布局化数据,而表的数据变革进程binlog恰好就是一份具偶然刻属性的流数据,流与表具有信息无损的彼此转换的特征,这种流表对偶性也抉择了Apache Flink可以回收SQL作为流使命的开拓说话。

作者:孙金城,混名 金竹,今朝就职于阿里巴巴,自2015年以来一向投入于基于Apache Flink的阿里巴巴计较平台Blink的计划研发事变。

【本文为51CTO专栏作者“金竹”原创稿件,转载请接洽原作者】

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读