加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据生态圈到底是一个什么观念?

发布时间:2018-10-13 05:54:36 所属栏目:大数据 来源:51CTO
导读:大数据这个观念自己就太大并且太宽,假如必然要严酷界说长短常坚苦的一件事,不外Hadoop生态圈可能由其延长的泛生态体系,根基上都是为了处理赏罚大量数据降生的一样平常而言,这种数据依靠单机很难完成。 这个圈子里的器材,就像是我们厨房里的各类厨具各自都有不

这时辰,另一个器材即将登场——Streaming计较模子。这种模子凡是被称为流计较模子,行使最多的平台式Storm。这种模子会在数据开始汇集的时辰举办计较,而不是在汇集完成后——你每得到一个数据城市插手到及时计较中成为最终成就的一份子。这种方法处理赏罚的数据根基不会存在耽误题目。

但它并不是精细绝伦。在行使流计较之前,我们必需预先找到统计的焦点,由于一段数据颠末处理赏罚就会放在一边——正如流过的河水无法倒回一样——未能提前找到统计焦点的时辰数据就被挥霍掉了。这也是流计较无法完全更换我们前文讲过的器材的缘故起因。

另一个较量独立的器材是KV Store,相同于Cassandra,HBase,MongoDB等等很是很是多的其他对象。他是什么意思呢,若是你有一堆键值,你就能通过某种方法快速得到键值背后的一大堆数据。就仿佛你去银行插入银行卡就能取到钱一样。

若是你特立独行,行使MapReduce完成也没有任何题目,可是由此带来的未便就是扫描数据库的时刻会很长。假如我们回收了KV Store,这种专门为了键值存取而设定的器材,那这个速率就会很是快。这个器材的焦点就是快,其他的工作他一概不管,就是要快。

除此之外,尚有一些更特制的体系/组件,好比Mahout是漫衍式呆板进修库,Protobuf是数据互换的编码和库,ZooKeeper是高同等性的漫衍存取协同体系,等等。

当你拿到这么多器材(乃至多到连许多对象的名字都写不纯熟)之后,你把他们拼装在一路,假如没有一个美满的布置各人就会相互斗殴,造成服从低下,以是这个时辰还要引入一个调治体系,专门给各人布置使命、布置时刻,使体系可以或许精采运转。

相干阅读:

大数据进修:Spark是什么,怎样用Spark举办数据说明

大数据的特点是什么,大数据与Hadoop有什么相关?

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读