操作UDW构建企业级数据客栈和BI体系
产物运营说明:产物存量、增添率、数据量等 数据源
题目说明数据源来历多数据有来自营业数据库,有来自CMDB数据,有监控数据,尚有日记体系内里的数据。 数据名目多样化除了布局化数据,照旧半布局化数据,尚有json名目标数据 即时查询多70%以上为姑且性的统计说明,许多需求无法提前预知。 产物运营数据平台不同一各个产物各自打点本身的运营数据、办理方案各自差异(Hive、MySQL、Mongodb、Elasticsearch等),打点伟大。 基于UDW的方案如下图所示,是基于UDW数据客栈的一个办理方案架构图。 大都据源的数据导入通过mysql2udw器材,按时增量的把营业数据导入到UDW;通过rsyslog把日记体系、监控体系的数据及时同步到Kafka,每隔一分钟把Kafka中最新的数据举办加工处理赏罚,然后导入到UDW中;CMDB内里的数据按期dump成CSV文件然后导入UDW;各个营业发生的运营数据通过UDW接话柄时的写入UDW。 JSON名目数据UDW已经支持JSON数据范例,可以在建设的表格的时行使JSON名目范例,很利便的处理赏罚JSON范例数据,如下所示。? (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |