Apache Flink 漫谈系列(13) - Table API 概述
GROUP BY 是对数据举办分组的操纵,好比我必要别离计较一下一个门生表内里女生和男生的人数别离是几多,如下: (1) Table API 示例 将order_tab信息按c_id分组统计订单数目,简朴示譬喻下:
(2) Result (3) 出格声名 在现实的营业场景中,GROUP BY除了按营业字段举办分组外,许多时辰用户也可以用时刻来举办分组(相等于分别窗口),好比统计每分钟的订单数目:
定时刻举办分组,查询每分钟的订单数目,如下:
声名:假如我们时刻字段是timestamp范例,提议行使内置的 DATE_FORMAT 函数。 5. UNION ALL UNION ALL 将两个表归并起来,要求两个表的字段完全同等,包罗字段范例、字段次序,语义对应相关代数的Union,只是相关代数是Set荟萃操纵,会有去一再操纵,UNION ALL 不举办去重,如下所示: (1) Table API 示例 我们简朴的将customer_tab查询2次,将查询功效归并起来,如下:
(2) Result (3) 出格声名 UNION ALL 对功效数据不举办去重,假如想对功效数据举办去重,传统数据库必要举办UNION操纵。 6. UNION UNION 将两个流给归并起来,要求两个流的字段完全同等,包罗字段范例、字段次序,并其UNION 差异于UNION ALL,UNION会对功效数据去重,与相关代数的Union语义同等,如下: (1) Table API 示例 我们简朴的将customer_tab查询2次,将查询功效归并起来,如下:
我们发明完全一样的表数据举办 UNION之后,数据是被去重的,UNION之后的数据并没有增进。 (2) Result (3) 出格声名 UNION 对功效数据举办去重,在现实的实现进程必要对数据举办排序操纵,以是非须要去重环境请行使UNION ALL操纵。 7. JOIN (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |