你的数据客栈还在为企业营业拖后腿吗?
该城商行通过回收Hive,Impala,Spark,HBase等种种技能来处理赏罚差异范例的数据,满意了批量、及时交互以及流式数据多种差异的数据计较必要,同时借助Sentry实现了多部分会见的数据安详节制。由于Hadoop平台能存储更多的数据,并且Impala查询机能晋升明明,该城商行正在基于这些大量的汗青数据发掘新的代价,如客户画像,精准营销,风险管控等。 据相识,今朝该城商行已经将大部门的Teradata数据客栈应用迁徙到Cloudera大数据平台,包罗CRM、禁锢报送、自助化说明、取数以及风险合规相干应用。同时,也基于大数据平台新建了一些应用,譬喻:及时营销和诓骗监控、在线明细查询等等。 数仓迁徙进程中的题目及办理方案 在数仓迁徙进程中,该城商行也碰着了一些技能上的挑衅,通过攻关研发,并团结之前的数仓开拓实践,逐渐探索出了响应的办理方案: 1、SQL引擎题目:办理了Teradata SQL迁徙的三大题目,使其满意数据客栈应用开拓的基本要求:
2、数据模子改革:传统数仓的数据模子存在以下题目:
新模子改革要领:
3、数据质量打点:通过建树数据质量检测平台来增强盛数据平台上的数据客栈一般数据质量打点的事变。该平台团结行内数据尺度界说,支持技能和营业法则批量设置。今朝已经设置了1000+搜查法则,为大数据平台之上的数据客栈数据质量题目提供了快速定位和流程化办理方案。 Cloudera助力企业举办传统数仓转型 最后,徐峰增补道,Cloudera可以或许通过以下三个方面助力企业举办数据客栈转型: 一是企业版加强成果。Cloudera推出了针对企业应用举办优化并包括响应器材和售后处事的数据客栈软件版本。相较于免费版本,企业用户可以得到源码级的技能支持处事,保障辖档同续不变运行;申请主动扫描集群处事,提前发明隐藏的风险和题目;行使包括加强成果的打点和维护器材集,简化体系运维和数据管理。 二是大数据咨询和专业处事。Cloudera拥有一支极富Hadoop实践履历的资深专家团队,该团队专门为数据客栈项目提供最佳的现场处事,包罗:提供办理方案架构、应用实现、产物行使、体系优化方面的咨询处事,提供集群按期康健搜查、集群妨碍时的告施舍助处事,以及基于客户需求举办定制化开拓事变等等。 三是人才培训。Cloudera大学是天下领先的培训和认证的机构,提供业界最普及的Apache Hadoop培训和认证。除了面向打点员、措施员、数据说明师和数据科学家差异脚色的贸易性培训之外,尚有公益性、学术性的培训和交换。Cloudera也与清华大学告竣了计谋相助,该项目旨在通过提供Hadoop平台上的课程、软件及技能培训来作育更多的专业人才。 结语 传统数据客栈很难顺应新期间的成长需求,面向云和大数据举办数据客栈转型已迫不及待,汲取前人履历,对现稀有仓举办优化,从而面向大数据技能举办安稳的数仓转型,是企业的最佳实践路径。显然,Cloudera在恒久的技能和客户处事进程中总结出了一条切实可行的实践之道,而且在数据客栈产物、咨询、处事、器材和人才作育等方面已经获得了历久的打磨和熬炼,想要举办数仓进级来满意全新营业需求的企业,不妨一试。 附:高朋简介 徐峰,现任Cloudera售前技能司理,资深办理方案参谋,首要认真金融行业Hadoop项目标整体架构计划实验,以及要害技能的研究事变。在此之前徐峰曾供职于Teradata专业处事部分,拥有14年纪据客栈项目实验履历,恒久从事数据存储、处理赏罚、说明等相干事变,曾作为首席架构师参加过多个大型数据客栈项目标架构计划和项目筹划事变,包罗浦发银行数据客栈项目、兴业银行数据客栈项目、上海农商银行数据客栈项目、交通银行数据客栈数据、东方航空数据客栈项目等等。 【51CTO原创稿件,相助站点转载请注明原文作者和出处为51CTO.com】 【责任编辑:查士加 TEL:(010)68476606】点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |