Apache Flink 漫谈系列(13) - Table API 概述
(c) Result(Bounded RANGE OVER Window)
OverWindow最重要是要领略每一行数据都确定一个窗口,同时今朝在Apache Flink中只支持定时刻字段排序。而且OverWindow开窗与GroupBy方法数据分组最大的差异在于,GroupBy数据分组统计时辰,在SELECT中除了GROUP BY的key,不能直接选择其他非key的字段,可是OverWindow没有这个限定,SELECT可以选择任何字段。好比一张表table(a,b,c,d)4个字段,假如按d分组求c的最大值,两种写完如下:
如上 OVER Window 固然PARTITION BY d,但SELECT 中如故可以选择 a,b,c字段。但在GROUPBY中,SELECT 只能选择 d 字段。 (2) Group Window 按照窗口数据分另外差异,今朝Apache Flink有如下3种Bounded Winodw:
声名: Aapche Flink 还支持UnBounded的 Group Window,也就是全局Window,流上全部数据都在一个窗口内里,语义很是简朴,这里不做具体先容了。 (a) Tumble
Tumble 转动窗口有牢靠size,窗口数据不重叠,详细语义如下:
操作pageAccess_tab测试数据,我们必要按差异区域统计每2分钟的淘宝首页的会见量(PV)。
(b) Hop (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |