大数据成长的8个要点

发布时间：2019-10-09 12:58:16 所属栏目：移动互联来源：佚名

导读：起首让我们来聊聊什么是大数据。大数据这个观念已经出来许多年了(高出 10 年)，但一向没有一个精确的界说(大概也并不必要)。数据工程师(DataEngineer)对大数据的领略会更多从技能和体系的角度去领略，而数据说明职员(Data Analyst)对大数据领略会从产物的

大数据技能就是对最原始的数据举办不绝处理赏罚加工提炼，金字塔每上去一层，对应的数据量会越小，同时对营业的影响代价会更大更快。而要从数据(Data) 最终提炼出伶俐(Wisdom)，数据要颠末一条很长的数据流链路，没有一套完备的体系担保整条链路的高效运转是很难担保最终从数据中提炼出来有代价的对象的，以是大数据将来产物全链路化是其它一个大的趋势。

大数据技能往下流数据斲丧和应用端转移

上面讲到了大数据的全链路成长趋势，那么这条长长的数据链路今朝的状况是怎样，将来又会有什么样的趋势呢?

我的判定是将来大数据技能的创新和发力会更多的转移到下流数据斲丧和应用端。之前十多年大数据的成长首要齐集在底层的框架，好比最开始引领大数据风潮的 Hadoop ，其后的计较引擎佼佼者 Spark，Flink 以及动静中间件 Kafka ，资源调治器 Kubernetes 等等，每个细分规模都涌现出了一系列优越的产物。总的来说，在底层技能框架这块，大数据规模已经根基打好了基本，接下来要做的是怎样操作这些技能为企业提供最佳用户体验的产物，以办理用户的现实营业题目，可能说将来大数据的偏重点将从底层走向上层。之前的大数据创新更方向于 IAAS 和 PAAS ，将来你将看到更多 SAAS 范例的大数据产物和创新。

从近期一些海外厂商的收购案例，我们可以略微看出一些眉目。

2019 年 6 月 7 日，谷歌公布以 26 亿美元收购了数据说明公司 Looker，并将该公司并入 Google Cloud。
2019 年 6 月 10 日，Salesforce 公布以 157 亿美元的全股票买卖营业收购 Tableau ，旨在夯其实数据可视化以及辅佐企业解读所行使和所蕴蓄的海量数据的其他器材方面的事变。
2019 年 9 月初，Cloudera 公布收购 Arcadia Data 。 Arcadia Data 是一家云原生 AI 驱动的贸易智能及时说明厂商。

面临最终用户的大数据产物将是将来大数据竞争的重点，我信托会将来大数据规模的创新也未来历于此，将来 5 年内或许率至少还会再出一个相同 Looker 这样的公司，可是很难再出一个相同 Spark 的计较引擎。

底层技能的齐集化和上层应用的全面着花

进修过大数据的人城市叹息大数据规模的对象真是多，出格是底层技能，感受学都学不来。颠末多年的厮杀和竞争，许多优越的产物已经脱颖而出，也有许多产物逐步走向灭亡。好比批处理赏罚规模的 Spark 引擎根基上已经成为批处理赏罚规模的佼佼者，传统的 MapReduce 除了一些旧有的体系，根基不太也许会开拓新的 MapReduce 应用。 Flink 也根基上成为低耽误流处理赏罚规模的不二选择，原有的 Storm 体系也开始逐步退出汗青舞台。同样 Kafka 也在动静中间件规模根基上占有了把持职位。将来的底层大数据生态圈中将不再有那么多的新的技能和框架，每个细分规模都将优胜劣汰，走向成熟，越发齐集化。将来更大的创新将更多来来自上层应用可能全链路的整合方面。在大数据的上层应用方面将来将会迎来有更多的创新和成长，好比基于大数据上的 BI 产物， AI 产物等等，某个垂直规模的大数据应用等等，我信托将来我们会看到更多这方面的创新和成长。

开源闭源并驾齐驱

大数据规模并不是只有 Hadoop，Spark，Flink 等这类各人耳熟能详的开源产物，尚有许多优越的闭源产物，好比 AWS 上的 Redshift ，阿里的 MaxCompute 等等。这些产物固然没有开源产物那么受开拓者接待，可是他们对付许多非互联网企业来说长短常受接待的。由于对付一个企业来说，回收哪种大数据产物有许多身分必要思量，否开源并不是独一尺度。产物是否不变，是否有贸易公司支持，是否足够安详，是否能和现有体系整合等等每每是某些企业更必要思量的对象，而闭源产物每每在这类企业级产物特征上具有上风。

最近几年开源产物受公有云的影响很是大，公有云可以无偿享受开源的成就，抢走了开源产物背后的贸易公司许多市场份额，以是最近许多开源产物背后的贸易公司开始改变计策，有些乃至修改了 Licence 。不外我认为公有云厂商不会杀死那些开源产物背后的贸易公司，不然就是不留余地，杀死开源产物背后的贸易公司，着实就是杀死开源产物的最大技能创新者，也就是杀死开源产物自己。我信托开源界和公有云厂商最终会取得一个均衡，开源如故会是一个主流，如故会是创新的主力，一些优越的闭源产物同样也会占有必然的市场空间。

最后我想再次总结下本文的几个要点：

今朝大数据已经渡过了最火的峰值期和泡沫化的底谷期，此刻正处于稳步向前成长的阶段。

数据局限会继承扩大，大数据将继承发扬光大
数据的及时性需求将越发突出
大数据基本办法往云上迁徙势不行挡
大数据产物全链路化
大数据技能往下流数据斲丧和应用端转移
底层技能的齐集化和上层应用的全面着花
开源闭源并驾齐驱

【编辑保举】

人工智能和大数据存在什么隐患？
大数据无处不在，安详性也必要云云

【责任编辑：未丽燕 TEL：（010）68476606】
点赞 0

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

联想拯救者Y90发售两周	这可能是全世界第二好
此次苹果AR设备真的来	iPhone 14系列泄露正