浅谈ODS与DW的区别-数据项目拭魅战总结
副问题[/!--empirenews.page--]
浅谈ODS与DW的区别-数据项目拭魅战总结 ? ODS 全称operation data store 可能 operational data store,中文意思是操纵型数据存储(数据被操纵发生的,譬喻电商买卖营业数据 (客户买对象订单)? 行业订单 工单数据(客户投诉数据) ),可能有的处所也叫运营数据仓储 1、在营业体系和数据客栈之间形成一个断绝层 粒度 注: 对付一条操纵型数据来说 有许多个属性 以电信行业投诉工单为例 ,有投诉时刻 号码归属地省 号码归属地市 投诉号码? 用户独一标示 投诉范例 投诉内容等等。 最细粒度 意思就是 到用户独一id 的统计数据,即详单数据 粗一点的粒度 等于不到用户这么细的统计数据 好比 到地市的统计数据 如 xx市 投诉用户总数 3、完成数据客栈中不能完成的一些成果 多维说明举例:照旧以电信行业投诉工单为例,时刻 号码归属地省市 投诉范例 这些都是常见的维度 ,可以统计一个月 某个省有几多工单数 可能 一天某个市 投诉宽带慢(投诉范例)的工单有几多个,相同这些 就叫多维说明 在一个没有ODS层的数据客栈应用体系系统布局中,数据客栈中存储的数据粒度是按照必要而确定的,但一样平常来说,最为细节的营业数据也是必要保存的,现实上也就相等于ODS,但与ODS所差异的是,这时的细节数据不是“当前、不绝变革的”数据,而是“汗青的,不再变革的”数据。 ? 数据客栈,是为企业全部级此外决定拟定进程,提供全部范例数据支持的计谋荟萃。它是单个数据存储,出于说明性陈诉和决定支持目标而建设。 为必要营业智能的企业,提供指导营业流程改造、监督时刻、本钱、质量以及节制 ? ? 1、数据客栈是面向主题的;操纵型数据库的数据组织面向事宜处理赏罚使命,而数据客栈中的数据是凭证必然的主题域举办组织。主题是指用户行使数据客栈举办决定时所体谅的重点方面,一个主题凡是与多个操纵型信息体系相干。 移动某省经分体系 率领和市场部决定说明时存眷的 几大重点方面 :4G 终端 政企 渠道 宽带等,各主题之间也许彼此尚有接洽 ,且好比渠道这个主题 也许核和渠道打点体系 crm体系 计费体系 都想关,由于必要从这些体系取数据 2、数据客栈是集成的,数据客栈的数据有来自于分手的操纵型数据,将所需数据从原本的数据中抽取出 ????? 跟营业出产体系严酷要求的数据不能冗余的同等精确性差异? ,dw的数据常常是冗余的 差异的表也许都有某个属性信息,由于dw表的数据凡是都是很大量的 可能高度聚合过的,假如想取某个属性 要通过表关联 这样的时刻耗损是很大的 ,可能都是聚合过得表 无法通过关联取得想要的指标 包罗数据源的描写信息 和 本身库、表的描写信息 。像源库的ip信息 本身库的ip信息 都属于元数据信息,凡是这些还挺重要 当ods涉及到数据共享的时辰,尚有较量重要的就是像一些字段的编码 表明 好比 是否智能机 0 1两个值 性别等。可能客户每月斲丧品级 1 代表1-100元 2 代表 100-150元。此类信息看着很简朴 可是现实做好元数据同一打点很重要。项目组曾经呈现过 有人月初误把一个是否智能机的元数据维表 的字段 0 1值改成了 Y N 。导致全部的涉及到的按时执行的存储进程 用的 case when 来统计智能机和非智能机的数目 所有出题目 。最后功效是全体加班从头跑数据。 ? 数据客栈和ods的数据源凡是都是多样化 有db? 文本 ws接口 动静行列等 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |