加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

BI导论——数据客栈概论

发布时间:2020-12-24 13:28:09 所属栏目:大数据 来源:网络整理
导读:1??????????书名《Building the Data WareHouse》作者:比尔.恩门 2??????????目标:将蕴蓄的数据酿成信息,以成立决定支持体系(DSS) 3??????????原有的DSS是破碎的,按需抽取的,导致一再与低效 4??????????原始数据与DSS数据比拟与差别 4.1?????????原始

1??????????书名《Building the Data WareHouse》作者:比尔.恩门

2??????????目标:将蕴蓄的数据酿成信息,以成立决定支持体系(DSS)

3??????????原有的DSS是破碎的,按需抽取的,导致一再与低效

4??????????原始数据与DSS数据比拟与差别

4.1?????????原始数据

4.1.1????面向应用,来自应用体系

4.1.2????具体的

4.1.3????为一般事变处事

4.2?????????DSS数据

4.2.1????面向主题,什么是主题?

4.2.2????综合的、提炼的

4.2.3????为打点者处事

5??????????什么是主题?主题是指决定说明时所重点存眷的方面,如对付一个购物中心的DSS体系来说,可以分为车流、客流、贩卖、会员、财政等主题

?

?

6??????????数据粒度:是指数据客栈中生涯的数据的综合水平的级别(具体水平)

7??????????数据支解:将数据支解成小的单位举办存储,如定时刻、地域、部分等尺度举办支解

8??????????因为DSS说明员无法界说本身的需求,以是需求驱动的方法并不合用,而不猜测需求也不可,计划数据客栈凡是介于两者之间,即去相识需求又去想象可能缔造需求

9??????????数据模子

9.1?????????提纲模子:描写实体相关

9.2?????????逻辑模子:描写字段与依靠

9.3?????????物理模子:就是现实实验后的数据库,首要界说机能与存储方法

10??????数据客栈的魂灵在于机动性和对数据的不行猜测的会见的满意上

?

?

11??????多维数据模子基于数据客栈而开拓是得当的,假如多维数据模子基于出产体系举办开拓,将导致大量一再的ETL事变

12??????元数据:界说数据的数据,如表的字段界说

13??????EIS:高级打点职员信息体系

13.1??????为高级打点职员举办决定帮助而计划

13.2??????趋势说明与发明

13.3??????要害指标怀抱与跟踪

13.4??????试探说明(切片、切块等)

13.5??????非常监控

13.6??????竞争说明

14??????数据客栈的成立

14.1??????按照现实环地步说主题

14.2??????成立数据模子,该模子描写了企业的信息需求

14.3??????说明出产体系(营业体系)的有效数据

14.4??????举办ETL开拓,将出产体系数据导入数据客栈

15??????需求的网络

15.1??????与相干营业部分交涉

15.2??????报表网络

15.3??????计谋性筹划的相识

15.4??????现有体系与营业流程的领略

?

?

16??????数据客栈与数据集市

16.1??????数据集市来历于数据客栈

16.2??????数据集市是部分级的,数据客栈是企业级的

16.3??????多维数据模子是数据集市的一种情势

17??????构建数据客栈步调

17.1??????确定主题,网络说明要揭示的主题,如要说明某年某月某门店的贩卖环境,这里就也许潜匿着贩卖主题

17.2??????确定怀抱,按照主题确定怀抱,如上面的贩卖主题,贩卖额就是怀抱,尚有贩卖数目等等

17.3??????确定究竟数据粒度,在能确定粒度级别时行使粒度级别,不然尽也许行使较小的粒度级别

17.4??????确定维度,从网络的主题中说明维度,如上面的年、月、门店就是一个个的维度

17.4.1 维度的条理布局与级别

17.4.1.1条理布局用来归类维度下的属性,好比时刻维度归类为“年-月”、“年-月-日”,“年-周”条理布局

17.4.1.2级别反应的是条理布局下的维度数据的条理次序,好比“年-月-日”条理布局,第一层为年,第二层为月、第三层为日

17.4.2 渐变维度,跟着时刻也许产生变革的维度,如住址,手机号等

17.4.3 维度范例

17.4.3.1平凡维度(星型模子),与究竟直接关联

17.4.3.2引用维度(雪花模子),与究竟不直接关联

17.4.3.3父子维度,自引用表

17.4.3.4多对多维度,一个属性值对应多个究竟,一个究竟对应多个属性值

17.5??????建设究竟表

?

?

18??????传统BI与大数据

18.1??????传统BI通过ETL汇总出产体系的数据到数据客栈,再基于数据客栈成立数据集市,然后举办数据集市的开拓应用

18.2??????大数据,如hadoop等,通过新的数据技能,通过计较机集群存储原始数据,可横向扩展,可举办及时说明

18.3??????大数据的上风是强盛的储存和计较成果,它办理了超大数据的储存和说明时效题目,可以说大数据是BI的重要增补,由于BI的上风是数据说明与基于算法的数据发掘

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读