加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

辨析BI、数据客栈、数据湖和数据中台内在及差别点

发布时间:2019-10-10 04:26:10 所属栏目:移动互联 来源:杨青
导读:媒介 跟着大数据技能的不绝更新和迭代,数据打点器材获得了飞速的成长,相干观念如雨后春笋一样平常应运而生,如从最初决定支持体系(DSS)到贸易智能(BI)、数据客栈、数据湖、数据中台等,这些观念出格轻易夹杂,本文对这些名词术语及内在举办体系的理会,便于
副问题[/!--empirenews.page--]

媒介

跟着大数据技能的不绝更新和迭代,数据打点器材获得了飞速的成长,相干观念如雨后春笋一样平常应运而生,如从最初决定支持体系(DSS)到贸易智能(BI)、数据客栈、数据湖、数据中台等,这些观念出格轻易夹杂,本文对这些名词术语及内在举办体系的理会,便于读者对数据平台相干的观念有全面的熟悉。

一、数据客栈

数据客栈平台慢慢从 BI 报表为主到说明为主、到猜测为主、再到操纵智能为方针。

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈成长阶段分别

商务智能(BI,Business Intelligence)是一种以提供决定说明性的运营数据为目标而成立的信息体系。是属于在线说明处理赏罚:On Line Analytical Processing (OLAP),将预先计较完成的汇总数据,储存于魔方数据库(Cube) 之中,针对伟大的说明查询,提供快速的相应。在前 10 年,BI 报表项目较量多,是数据客栈项目标前期预热项目(首要说明为主的阶段,是数据客栈的低级阶段),建造一些可视化报表揭示给打点者。

  • 它操作信息科技,将分手于企业内、外部各类数据加以整归并转换成常识,并依据某些特定的主题需求,举办决定说明和运算;
  • 用户则通过报表、图表、多维度说明的方法,探求办理营业题目所必要的方案;
  • 这些功效将呈报给决定者,以支持计策性的决定和界说组织绩效,可能融入智能常识库自动向客户推送。

1. 1 数据客栈根基界说

数据客栈(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对不变的(Non-Volatile)、反应汗青变革的(Time Variant)数据荟萃,用于支持打点决定和信息的全局共享。其首要成果是将组织透过资讯体系之联机事宜处理赏罚(OLTP)经年累月所累积的大量资料,透过数据客栈理论所特有的资料储存架构,作一有体系的说明清算,以利各类说明要领如联机说明处理赏罚(OLAP)、数据发掘(Data Mining)之举办,并进而支持如决定支持体系(DSS)、主管资讯体系(EIS)之建设,辅佐决定者能快速有用的自大量资料中,说明出有代价的资讯,以利决定制定及快速回应外在情形变换,辅佐建构贸易智能(BI)。

  • 所谓主题:是指用户行使数据客栈举办决定时所体谅的重点方面,如:收入、客户、贩卖渠道等;所谓面向主题,是指数据客栈内的信息是按主题举办组织的,而不是像营业支撑体系那样是凭证营业成果举办组织的。
  • 所谓集成:是指数据客栈中的信息不是从各个营业体系中简朴抽取出来的,而是颠末一系列加工、清算和汇总的进程,因此数据客栈中的信息是关于整个企业的同等的全局信息。
  • 所谓随时刻变革:是指数据客栈内的信息并不可是反应企业当前的状态,而是记录了从已往某一时点到当前各个阶段的信息。通过这些信息,可以对企业的成长过程和将来趋势做出定量说明和猜测。

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈逻辑架构

1. 2 数据客栈体系浸染和定位

数据客栈体系的浸染能实现跨营业条线、跨体系的数据整合,为打点说明和营业决定提供同一的数据支持。数据客栈可以或许从基础上辅佐你把公司的运营数据转化成为高代价的可以获取的信息(或常识),而且在适当的时辰通过适当的方法把适当的信息转达给适当的人。

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈的浸染

  • 是面向企业中、高级打点举办营业说明和绩效查核的数据整合、说明和揭示的器材;
  • 是首要用于汗青性、综合性和深条理数据说明;
  • 数据来历是 ERP(例:SAP)体系或其他营业体系;
  • 可以或许提供机动、直观、简捷和易于操纵的多维查询说明;
  • 不是一般买卖营业操纵体系,不能直接发生买卖营业数据;

数据客栈针对及时数据处理赏罚,非布局化数据处理赏罚手段较弱,以及在营业在预警猜测方面应用相对有限。

1. 3 数据客栈能提供什么

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈提供代价

1. 4 数据客栈体系组成

数据客栈体系除了包括说明产物自己之外,还包括数据集成、数据存储、数据计较、派别揭示、平台打点等其余一系列的产物。

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈产物组成

辨析BI、数据客栈、数据湖和数据中台内在及差别点


数据客栈产物组成

二、数据湖

数据湖(Data Lake)是 Pentaho 的 CTO James Dixon 提出来的(Pentaho 作为一家 BI 公司在理念上是挺先辈的),是一种数据存储理念——即在体系或存储库中以天然名目存储数据的要领。

2. 1 维基百科对数据湖的界说

数据湖(Data Lake)是一个存储企业的各类百般原始数据的大型客栈,个中的数据可供存取、处理赏罚、说明及传输。数据湖是以其天然名目存储的数据的体系或存储库,凡是是工具 blob 或文件。数据湖凡是是企业全部数据的单一存储,包罗源体系数据的原始副本,以及用于陈诉、可视化、说明和呆板进修等使命的转换数据。数据湖可以包罗来自相关数据库(行和列)的布局化数据,半布局化数据(CSV,日记,XML,JSON),非布局化数据(电子邮件,文档,PDF)和二进制数据(图像,音频,视频)。来历:维基百科。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读