你的数据客栈还在为企业营业拖后腿吗?
副问题[/!--empirenews.page--]
【51CTO.com原创稿件】 ——传统数据客栈向大数据的渐进式转型 数据客栈体系恒久以来一向是企业IT架构的重要构成部门。跟着开源技能的不绝成长以及云端陈设方法的不绝深入,传统数据客栈的范围性日益凸显,难以顺应新技能带来的市场厘革,怎样面向大数据技能举办数据客栈的优化、转型是企业IT打点者面对的重要挑衅。处于差异阶段的企业怎样应用大数据技能?怎样面向大数据技能举办数据客栈转型?怎样对现稀有据客栈举办优化?如安在Hadoop中举办机能优化?这些已成为困扰IT打点者的首要题目。 带着诸多疑问,51CTO记者采访了Cloudera售前技能司理、资深办理方案参谋徐峰老师,徐峰拥有14年纪据客栈的项目实验履历,曾作为首席架构师参加过多个大型数据客栈项目标架构计划和项目筹划事变。徐峰暗示,数字化期间,跟着企业内部数据的快速增添,以及外部数据收罗本钱的不绝低落,传统数仓在数据存储和说明应用上都面对着庞大的挑衅。 现有的数仓情形 传统数仓面对以下范围性:
数据客栈泛起三大成长趋势
企业该怎样举办技能选择? 针对这一题目,徐峰以为,企业应按照所处的差异阶段举办选择:
将数据客栈筹划在Hadoop之上? “企业可以选择从一开始就将整个数据客栈筹划在Hadoop之上。传统数据客栈架构的首要首创人Ralph Kimball博士在2015年颁发专题演讲时证实了Hadoop是可以完全代替MPP来成立数据客栈的。”徐峰提到,“在环球范畴内,也确实有许多企业已经将他们的数据客栈完全成立在Hadoop之上。” 可是从技能的角度,有一些数据客栈技能或器材与Hadoop对比已很是成熟,也许已稀有十年的汗青,对付这些恒久应用的数据库技能,Hadoop并不具备个中全部的成果或机能。但即便云云,许多用户如故选择把他们的数据客栈构建在Hadoop架构之上,这是为了可以或许实现越发良好的可扩展性、更高的性价比,以及更好的机动性。在现实应用中,纵然是局限只有5个节点的小集群,企业行使Hadoop与其他技能选项对比,也可以或许取得更好的产出、带来更多的营业代价与竞争力。 Cloudera说明型数据库全面进级 针对当前企业级数据客栈(EDW)面对的ETL批量功课运行迟钝、BI报表不能定时天生、营业用户提交的查询迟迟表现不了功效等压力,团结当前数仓成长的趋势,以及企业的云化需求,Cloudera说明型数据库版本举办了全面进级,于2018年8月正式推出了Cloudera数据客栈版本。 徐峰先容,Cloudera说明型数据库已经在环球最大的900多家组织机构里运行,是一款经验过拭魅战打磨的产物。进级后的Cloudera数据客栈版本提供了企业级殽杂云办理方案,包括了殽杂计较、殽杂存储、殽杂节制三大要害身分,专为实惠经济、强盛可扩展的自助处事说明而构建。这款产物包围了数据客栈的整个生命周期,包罗数据接入、存储、打点、查询、运行状况搜查等等。 Cloudera数据客栈版本合用于以下三场景 ETL卸载:将ETL使命从EDW迁徙到Cloudera大数据平台,极大的开释EDW处理赏罚手段。基于Hadoop大局限漫衍式的处理赏罚手段,ETL使命将以更快的速率运行,并为包罗EDW在内的下流体系提供处事,使得之前错过的SLA成为汗青。 自助BI和试探性说明:全面开放数据,全部部分的用户在其安详计策范畴内都能自助会见全真数据。借助Read on Schema的机动性和支持高并发的查询手段,开拓职员和说明职员可以或许实现自助化数据试探,挣脱对IT部分的依靠,能最快的速率办理新题目。 EDW优化:通过Cloudera大数据平台开释EDW处理赏罚手段,您可以将EDW体系用于越发伟大的报表天生和热数据处理赏罚,在相等长的一段时刻内都无需增进EDW存储或计较资源。 EDW和Cloudera大数据平台的混搭布局可以低落数据存储本钱,进步数据处理赏罚和说明手段,充实验展两套体系各自的技能上风。 Cloudera数据客栈版本的四大上风 亘古未有的数据局限和机动性:Cloudera提供单一、可扩展的平台,可以处理赏罚差异来历、差异范例的全量数据,以敦促新的营业洞察。该版本专为Read on Schema成果而计划,可以快速会见贴源的全真数据,乃至支持及时更新。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |