加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

BI入门经典

发布时间:2021-01-01 14:58:14 所属栏目:大数据 来源:网络整理
导读:【媒介】 ?????昨天论坛的SQL Server大版新增了一个BI板块,各人接头得热火朝天,因为此前由于客户情形的题目,一向在行使sql 2000,没怎么存眷这一块的对象,最近恰恰要做购物篮的说明,以是到网上汇集了一些资料。为了跟各人保持“法式同等”,也写点或转
副问题[/!--empirenews.page--]

【媒介】

?????昨天论坛的SQL Server大版新增了一个BI板块,各人接头得热火朝天,因为此前由于客户情形的题目,一向在行使sql 2000,没怎么存眷这一块的对象,最近恰恰要做购物篮的说明,以是到网上汇集了一些资料。为了跟各人保持“法式同等”,也写点或转点对象出来,和各人一路进修和分享。

????这是很好的BI入门资料,对付还不知道BI是什么,为什么要搞BI,以及BI能做什么的伴侣来说,应该照旧较量有辅佐的。很痛惜的时辰文章中的图片找不到了(文中涉及到参考图片的那部门请忽略),到网上找了一下也没找到,假若有保藏到这部门图片的伴侣或看到有这部门图片的伴侣,接待共享一下。

【转贴内容】

(1)老板,你要这么大都据做什么? ????
??? 若是你是一个商品零售公司的老板。
??? 你的公司很先辈,已经实现了营业信息化,每一笔贩卖单子都生涯在数据库中,日积月累,已经生涯了十余年的贩卖数据,上亿条贩卖记录。
??? 这时假如我问你:“横竖三年前的数据留着也白白占处所,淹灭存储本钱,索性把它们全删掉吧,这样不消买硬盘就能容纳新数据,怎样?”
??? 你会从容的接管我这个提议吗?
??? 那么老板,你要这么大都据做什么?
??? 是的,和我一样,你也已经隐隐熟悉到数据的代价,这就是我们割舍不下汗青数据的缘故起因,就像任何一个当代化企业,乃至就像任何一个传统的票号,如百大哥店般虔敬地生涯着迂腐的数据,由于我们有直觉,我们的直觉汇报我们:这些数据有效!
??? 但这仅仅是一种直觉,到底该奈何把这些占有大量存储空间的数据的代价发掘出来,让这些数据从本钱的耗损者酿成利润的促进者?
??? 这中间好像穷乏了某些环节。
(2) Business Intelligence - 毗连数据与决定者??? ?
??? BI(BusinessIntelligence) 是一种运用了数据客栈、在线说明和数据发掘等技能来处理赏罚和说明数据的极新技能,目标是为企业决定者提供决定支持。
??? 让我们振臂高呼三遍:决定支持,决定支持,决定支持!
??? BI 是一个工场:
??????? >> BI 的原原料是海量的数据;
??????? >> BI 的产物是由数据加工而来的信息和常识;
??????? >> BI 将这些产物推送给企业决定者;
??????? >> 企业决定者操作 BI 工场的产物做出正确的决定,促进企业的成长;
??? 这就是 Business Intelligence,即贸易智能——毗连数据与决定者,变数据为代价。
??? BI 应用的两大种别是信息类应用 和 常识类应用,其特性如下表所示:

?

(3) BI 低级应用模式概览——数据查询(Querying)????
??? 数据查询是最简朴的 BI 应用,属于 MIS 体系遗产,固然身世较量老土,可是今朝如故是决定者获守信息的最直接的要领。
??? 现在,数据查询界面已经彻底挣脱了传统 SQL 呼吁行,大量的下拉菜单、输入框、列表框等元素乃至是鼠标拖拽界面将靠山干夫役的 SQL 语句包装成一个妖艳无比的数据获取体系,而本质如故没有分开数据查询的几大体素:
?? >> 查什么
?? >> 从哪儿查
?? >> 过滤前提
?? >> 展示要领
??? 今朝海外较量风行的数据查询应用已经完全开释了数据查询的机动性,如右图所示的是 Cognos ReportNet 的数据查询界面 Query Studio,应承用户通过纯赏识器界面,以鼠标拖拽操纵界说数据查询要素,并以报表和图表等多种方法揭示数据。

(4) BI 低级应用模式概览——报表(Reporting)???
??? 报表是海内最热衷的 BI 应用之一,这与报表在我国企奇迹单元中的汗青职位是分不开的。我国的报表以其名目诡异、数据齐集、法则离奇等特性著称于世,曾经让无数海外报表器材和 BI 器材捶胸顿足。
??? 报表的两大体素是数据和名目,假如没著名目,则报表应用险些等同于数据查询应用。可以说,报表就是将查询出来的数据凭证指定的名目揭示。
??? 报表应用包括了报表揭示和报表建造两大模块。报表揭示就是让决定者看到报表,并应承决定者通过前提界说来选择报表数据,譬喻选择报表年度、部分、机构等等;报表建造面向报表的开拓职员,其名目界说机动性、数据映射机动性、计较要领的富厚水划一均影响了 BI 报表应用的质量。
??? 必要澄清一下的是,Microsoft Excel 不算是一个 BI 报表器材,由于 Excel 没有毗连数据源的手段,充其量是一个 Spread Sheet。可是 Excel 强盛的名目成果让报表建造职员竟折腰,以致到其后,险些全部 BI 厂商都提供了面向 Microsoft Excel 的插件,通过插件,Excel 可以毗连到 BI 的数据源上,摇身一变为 BI 报表器材,丑小鸭变天鹅。


5) BI 高级应用模式概览——在线说明(OnLine AnalyticalProcessing,OLAP)?????
??? OLAP ,即联机说明处理赏罚,是 BI 带来的一种全新的数据调查方法,是 BI 的焦点技能之一。
??? 我们知道,数据在数据库中是以数据表来存储的,好比某市肆的贩卖数据存储在如下所示的一张数据表中:

决定者但愿知道的每每是漫衍、占比、趋势之类的宏观信息,好比下列题目:

?????? >> 北京地域的贩卖数目虽时刻的变革趋势?

?????? >> 哪种产物在 2005 年贩卖比 2004 年贩卖增幅最大?

?????? >> 2004 年各产物贩卖额的比例漫衍?……

???面临这种需求,必需用 SQL 语句举办大量的 SUM 操纵,每得出一个题目的功效,就必要 SQL SUM。面临上面的 7 笔记录,我们可以很轻易的得出功效,可是当我们面临百万级乃至亿级的记录条数时,譬喻移动公司通话数据,每次 SQL SUM 都必要耗损大量的时刻来计较,决定者常常是在第一天提出说明需求,比及第二天才气拿到计较功效,这种说明方法是“脱机说明”,服从很低。

???为了进步数据说明服从,OLAP 技能彻底冲破以记录为单元的数据赏识方法,而将数据疏散为“维度(Dimension)”和“怀抱(Measure)”:

?????? >>维度是调查数据的角度,譬喻上面示例中的“贩卖时刻”、“贩卖所在”、“产物”;

?????? >> 怀抱是详细考查的数目值,譬喻上例中的“贩卖数目”和“贩卖金额”;

???这样一来,我们就可以将上面这张平版的数据列表转换为一个拥有三个维度的数据立方体( Cube ):

而探查数据的进程,就是在这个立方体中确定一个点,然后调查这个点的怀抱值:

虽然,数据立方体并不范围于三个维度,这里回收三个维度来声名题目,只是由于通过图形可以示意出来的极限就是三个维度。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读